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内 容 简 介 

本 书 介绍 了 算法 设计 与 分 析 的 基本 技巧 ， 主 要 包括 递归 、 分 治 、 动 态 规划 、 贪 心 和 随机 等 算法 ， 以 及 
利用 这 些 算 法 求解 计算 问题 的 时 间 复 杂 度 分 析 等 内 容 。 通过 诸多 有 趣 的 实例 ， 向 读者 介绍 了 算法 设计 的 思 
想 ， 以 便 读 者 能 形成 算法 思维 的 固定 模式 去 解决 问题 。 在 介绍 每 一 类 算法 范式 以 及 分 析 算法 复杂 度 时 ， 都 
力求 建立 直观 的 思维 过 程 ， 而 据 弃 过 深 的 数学 证 明 。 书 中 所 有 算法 均 采 用 Python 语言 描述 ， 读 者 能 从 中 
学 习 到 许多 算法 实现 的 技巧 ， 从 而 提高 编写 程序 的 能 力 。 

本 书 可 作为 高 等 学 校 计算 机 专业 大 一 、 大 二 或 者 学 习 过 程序 设计 的 非 计算 机 专业 学 生 的 算法 设计 与 分 
析 教 材 。 
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“算法 设计 与 分 析 ” 是 计算 机 专业 非常 重要 的 一 门 基础 课程 ， 它 不 仅 是 诸多 计算 机 
专业 课程 的 基础 ， 也 是 许多 信息 科技 类 公司 招聘 程序 员 时 , 笔试 与 面试 重点 考核 的 内 容 。 
算法 设计 与 分 析 已 经 有 了 诸多 经 典 的 著作 ， 比 如 美国 麻 省 理工 学 院 (MIT) 几 位 教授 合 
著 的 《算法 导论 》@ 等。 然而 , 这 些 经 典 著作 当 作 教材 使 用 时 , 都 会 存在 对 内 容 进行 适当 
裁剪 ,以 便 更 适合 48 或 者 32 个 学 时 教学 的 问题 。 我 们 写本 书 的 目的 就 是 对 初等 算法 内 
容 进行 合理 的 编排 ,让 初学 者 能 很 快 地 掌握 解决 计算 问题 的 常用 算法 ,以 及 分 析 算 法 效 
率 的 方法 。 

本 书 算 法 均 采 用 Python 语言 进行 描述 , Python 是 一 类 解释 性 语言 , 其 语法 简单 直 
观 , 有 一 定 程序 设计 基础 的 学 生 可 以 很 快 入 门 。 Python 语法 简单 并 不 意味 着 功能 弱 , 它 
在 科学 计算 、Web 应 用 等 诸多 领域 都 有 着 广泛 的 应 用 。 国 外 知名 的 高 校 , 如 麻 省 理工 学 
院 , 也 在 算法 设计 课 中 采用 Python 语言 描述 。 与 采用 伪 代 码 描述 算法 的 书 比 较 而 言 , 采 
用 Python 描述 算法 能 给 读者 直接 的 运算 结果 ， 从 而 可 以 使 读者 更 易于 揣摩 算法 实现 的 
技巧 。 

计算 机 算法 不 仅 涉及 诸多 理论 , 还 有 各 种 技术 细节 。 比 如 介绍 随机 算法 时 ， 有 些 执 
行 时 间 的 分 析 就 需要 较 多 的 概率 论 知识 ; 而 算法 实现 技术 细节 则 不 仅 关 注 如 何 存 储 数 
据 ， 甚 至 对 执行 算法 的 硬件 环境 也 会 考虑 在 内 。 本 书 的 内 容 安排 则 介 于 两 者 之 间 , 在 数 
学 分 析 与 实现 之 间 期 望 取得 合理 的 平衡 。 首先 , 在 分 析 算 法 效率 时 尽量 避免 过 深 的 数学 
证 明 , 但 关键 步骤 依然 会 给 出 直观 的 解释 。 其 次 , 在 实现 算法 时 本 书 尽量 利用 Python 已 
有 的 数据 结构 和 库 函 数 ， 从 而 简化 算法 实现 的 技术 难度 。 

如 果 将 要 处 理 的 数据 、 问题 看 作 是 食材 , 那么 算法 就 是 将 食材 “转化 ”成 各 种 令 人 垂 
泛 的 美食 的 过 程 。 中 国 菜 肴 到 处 都 是 充满 想象 力 的 转化 , 将 原本 普通 的 食材 (如 大 豆 和 
糯米 等 ) 转化 为 营养 和 美味 的 食物 (豆腐 、 酒 酿 和 效 料 等 )。 本 书 的 主线 就 是 转化 , 它 不 
仅 有 问题 的 转化 , 也 有 方法 的 转化 (如 图 1 所 示 )。 通 过 问题 的 转化 将 问题 “化 繁 为 简 ”， 
通过 方法 的 转化 以 便 融会 贯通 各 种 算法 设计 的 技巧 。 








本 书 主要 内 容 


由 于 计算 机 已 经 成 为 现代 科技 、 生 活 不 可 缺少 的 工具 。 因 此 , 解决 计算 问题 的 算法 
涉及 的 内 容 可 以 说 包罗 万 象 ， 从 简单 的 排序 和 查找 到 复杂 的 语音 识别 、 文字 翻译 , 甚至 


外 见 参考 文献 [1]。 
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图 1 本 书 的 主线 一 一 转化 


游戏 等 都 离 不 开 算法 。 本 书 内 容 涵盖 了 大 部 分 的 经 典 算法 , 主要 内 容 包 括 递 归 算 法 、 分 
治 算法 、 排 序 算法 、 动态 规划 算法 、 图 搜索 算法 、 最 大 流 算法 、 随 机 算法 和 算法 复杂 度 。 

第 1 章 主要 介绍 算法 的 基本 概念 , 通过 实例 向 读者 展示 解决 同一 问题 的 不 同 算法 的 
确 存在 效率 上 显著 的 差异 。 第 2 章 介 绍 度量 算法 效率 的 记号 ， 以 及 分 析 简 单 函数 执行 时 
间 的 常用 技巧 。 第 3 章 通 过 解决 文档 比较 、 单 词 拼写 纠正 和 稳定 匹配 这 三 个 有 趣 的 问题 ， 
帮助 读者 熟悉 Python 语言 。 第 4 章 介绍 了 递归 算法 以 及 递归 函数 求解 ， 从 而 为 后 续 章 
节 复 杂 的 算法 设计 与 分 析 打 下 一 定 的 基础 。 第 5 章 介绍 了 组 织 数据 的 两 个 常用 方法 : 排 
序 和 数据 结构 ,主要 强调 递归 在 组 织 数据 中 的 应 用 , 帮助 读者 进一步 熟悉 采用 递归 求解 
问题 的 过 程 。 

第 6 章 到 第 11 章 则 分 别 介绍 了 分 治 算法 、 图 搜索 、 贪心、 动态 规划 、 最 大 流 和 随机 
算法 。 通过 各 种 有 趣 的 问题 , 向 读者 展示 转化 的 基本 技巧 ， 以 便 更 好 地 帮助 读者 建立 采 
用 算法 思维 去 解决 问题 的 习惯 。 第 12 章 介 绍 了 算法 复杂 度 , 帮助 读者 明确 哪 类 问题 “可 
解 ”， 而 哪 类 问题 目前 “不 可 解 ”。 

本 书 由 程 振 波 总 体 设计 和 规划 。 第 2 到 第 12 章 由 程 振 波 编写 , 第 1 章 由 程 振 波 、 
李 曲 和 王 春 平 编写 。 全 书 由 程 振 波 统 稿 。 








如 何 使 用 本 书 


本 书 的 内 容 框架 是 笔者 在 浙江 工业 大 学 “算法 设计 与 分 析 ” 课 程 的 讲义 ,内 容 的 编 
排 则 参考 了 MIT 的 算法 课程 6.006。 因此 , 本 书 从 内 容 安 排 来 说 非常 适合 学 时 为 48 
或 者 32 学 时 的 算法 课程 。 对 于 教师 而 言 , 可 以 直接 按照 本 书 的 章节 安排 教学 计划 。 为 了 
便于 教师 安排 教学 , 具体 的 教学 建议 如 下 : 








@ MIT 将 “算法 设计 与 分 析 ” 课 程 分 解 成 了 两 门 课 . 一 门 是 6.006, 该 课程 主要 是 算法 的 入 门 课程 ,可 以 面向 各 个 专 
业 开 设 。 男 一 门 则 是 6.046, 这 是 一 门面 向 有 一 定 算法 基础 的 学 生 开 设 的 算法 课程 。 
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学 习 要 点 及 教学 内 容 





第 2 章 渐进 分 析 与 
Python 计算 模型 


第 3 章 问题 求解 
与 代码 优化 


第 4 章 递归 算法 与 
递归 函数 


掌握 算法 的 定义 。 了 解 算法 的 来 源 ,理解 现实 生活 中 
解决 问题 的 办 法 与 算法 之 间 的 关系 ; 掌握 衡量 算法 的 
属性 , 尤其 是 正确 性 和 时 间 效 率 对 算法 的 意义 。 
掌握 算法 效率 的 基本 概念 。 理 解 直接 计算 某 个 输入 规 
模 的 时 间 来 衡量 算法 效率 的 不 足 ; 了 解 渐进 分 析 法 以 
及 多 项 式 时 间 复 杂 度 与 指数 时 间 复 杂 度 的 区 别 。 

了 解 求解 问题 可 能 存在 效率 不 同 的 算法 。 掌握 求解 
一 维 高 点 问题 的 简单 算法 及 改进 算法 。 

掌握 哈 希 表 的 基本 概念 。 


掌握 运行 算法 的 简化 模型 。 了 解 单 处 理 器 随机 访问 机 
器 模型 的 结构 ,以 及 运行 在 该 机 器 模型 上 常见 指令 的 
执行 时 间 。 

掌握 算法 渐进 分 析 的 概念 。 熟悉 三 种 渐进 函数 的 定 
义 , 以 及 常见 函数 的 渐进 表示 。 

熟练 掌握 基本 函数 的 渐进 分 析 。 熟悉 Python 的 判 
断 、 循 环 语句 写法 , 熟练 掌握 Python 的 基本 数据 结 
构 的 使 用 。 掌 握 较 为 复杂 的 函数 的 时 间 复杂 度 分 析 
如 求 最 大 值 、 二 分 搜索 等 。 


基本 掌握 使 用 Python 求解 较为 复杂 的 问题 。 
了 解 文档 比较 问题 及 其 算法 。 

了 解 单词 拼写 问题 及 其 实现 算法 。 

了 解 稳定 匹配 问题 及 其 实现 算法 。 


熟悉 递归 的 组 成 结构 。 熟 练 掌握 递归 算法 的 两 个 基本 
组 成 ,以 及 它们 各 自 的 作用 。 

掌握 递归 算法 执行 的 过 程 。 了 解 递归 算法 在 机 器 模型 
中 的 运行 过 程 。 

熟练 掌握 常见 问题 的 递归 求解 方法 。 熟 悉 回 文 、 全 排 
列 和 汉 诺 塔 问题 的 递归 算法 。 

熟练 掌握 求解 标准 递归 函数 T(n) = aT(n/b) + f(n) 
的 方法 。 掌握 替换 法 和 主 分 析 法 求解 递归 函数 的 过 
程 ,理解 主 分 析 法 的 三 类 条 件 及 其 对 应 的 解 。 
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教学 内 容 


学 习 要 点 及 教学 内 容 


课时 安排 





第 5 章 排序 与 树 结构 


第 7 章 图 搜索 算法 


第 8 章 ”贪心 算法 


熟悉 插入 排序 、 选 择 排序 和 合并 排序 算法 。 能 熟练 
写 出 这 三 个 排序 算法 的 实现 代码 以 及 它们 各 自 的 
时 间 复 杂 度 。 

掌握 二 又 搜索 树 的 基本 数据 操作 。 能 从 使 用 场景 的 
角度 理解 二 叉 树 与 数组 、 链 表 等 数据 结构 的 不 同 。 
掌握 基于 二 又 搜 索 树 常见 的 数据 操作 ， 比 如 插入 、 
删除 和 查找 等 。 

熟练 掌握 堆 结构 的 应 用 场景 和 数据 操作 。 熟悉 建 堆 
算法 及 其 时 间 复 杂 度 分 析 ， 了 解 基于 堆 的 排序 和 合 
并 大 个 有 序 序列 等 应 用 。 


掌握 分 治 算法 求解 问题 的 三 个 基本 步骤 。 

掌握 利用 分 治 法 求解 一 些 典型 问题 ， 如 序列 最 大 差 
值 区 间 、 统 计 逆序 数 、 空 间 点 最 小 距离 和 序列 中 第 
大 小 的 数 等 问题 。 

熟悉 如 何 将 问题 进行 分 解 ， 以 及 合并 子 问题 解 的 常 
用 技巧 。 掌 握 分 治 算法 的 时 间 复 杂 度 分 析 。 


熟悉 图 的 两 种 常见 表示 方法 , 熟练 掌握 如 何在 计算 
机 中 存储 图 。 了 解 图 在 计算 机 应 用 领域 常见 的 应 用 
场景 。 
熟练 掌握 图 上 宽度 优先 搜索 算法 及 其 算法 复杂 度 
分 析 ， 了解 利用 宽度 优先 搜索 解决 计算 问题 的 建 模 
过 程 。 
熟练 掌握 图 上 深度 优先 搜索 算法 及 其 算法 复杂 度 
分 析 ， 了解 利用 深度 优先 搜索 解决 计算 问题 的 建 模 
过 程 。 


本 解 贪心 算法 求解 优化 问题 的 过 程 。 

熟练 掌握 利用 贪心 算法 求解 典型 的 计算 问题 , 如 硬 
币 找 零 、 间 隔 任务 规划 等 问题 。 了 解 利用 替换 法 证 
明 贪心 策略 是 否 能 获得 全 局 最 优 解 的 过 程 。 
熟练 掌握 贪心 算法 在 两 个 典型 图 搜索 中 的 应 用 ， 即 
单 源 最 短路 径 和 最 小 生成 树 。 理 解 单 源 最 短路 径 和 
最 小 生成 树 算法 中 , 利用 合理 的 数据 结构 优化 算法 
复杂 度 的 技巧 。 





前 二 


了 











教学 内 容 


学 习 要 点 及 教学 内 容 


课时 安排 





第 9 章 动态 规划 算法 


第 10 章 最 大 流 算法 


第 11 章 随机 算法 


第 12 章 算法 复杂 度 


。 理解 动态 规划 求解 优化 问题 的 典型 步骤 , 以 及 动态 
规划 算法 求解 计算 问题 的 时 间 复 杂 度 分 析 。 

。 熟练 掌握 利用 动态 规划 算法 求解 一 维 、 二 维 等 典型 

优化 问题 , 如 斐 波 那 契 数 、 拾 捡 硬币 、 连 续 子 序列 

的 最 大 值 、 和 矩阵 的 括号 、0-1 背包 问题 等 。 

对 于 简单 问题 能 画 出 其 动态 规划 表 , 并 能 从 中 得 到 

问题 的 解 。 


掌握 最 大 流 问 题 的 定义 ， 了 解 流量 、 容 量 以 及 它们 
之 间 的 关系 。 

掌握 通过 增 广 路 径 求 最 大 流 问 题 的 Ford- 
Fulkerson 和 Edmond-Karp 算法 ,理解 这 两 个 算 
法 之 间 的 异同 。 

了 解 将 计算 问题 转化 为 最 大 流 问 题 的 基本 过 程 。 掌 
握 通 过 最 大 流 算法 求解 二 向 图 最 大 匹配 和 文件 传 
输 中 的 不 重合 边 等 问题 的 方法 。 


了 解 两 种 典型 的 随机 算法 : 蒙特 卡 洛 和 拉 斯 维 加 斯 
算法 ， 以 及 它们 之 间 的 异同 。 

熟练 掌握 利用 随机 算法 求解 典型 的 计算 问题 如 扼 
阵 乘积 结果 验证 、 快速 排序 、 选 择 第 小 的 数 和 最 
小 割 验 证 等 。 

了 解 随机 快速 排序 算法 复杂 度 分 析 过 程 。 


了 解 如 何 根据 问题 求解 的 难 易 程度 对 计算 问题 进 
行 基本 分 类 。 
理解 P 问题 、NP 问题 和 NPC 问题 的 定义 。 


了 解 几 个 典型 的 NPC 问题 , 理解 为 什么 证 明 P 是 
否 等 于 NP 是 计算 机 领域 最 为 重要 的 问题 之 一 。 








对 学 生 而 言 ,， 先 阅读 书 中 各 章节 内 容 , 然后 运行 书 中 代码 以 便 检验 对 算法 的 理解 程 
度 。 特别 是 , 学 生还 应 该 独立 重复 出 书 中 各 个 问题 的 算法 , 这 个 过 程 就 好 比 学 习 围棋 的 
选手 进行 复 盘 一 样 。 如 果 仅 仅 是 了 解 算法 原理 , 而 没有 通过 写 代码 来 实现 算法 , 将 不 利 





于 读者 培养 独立 解决 问题 的 能 力 。 


此 外 , 除了 课 后 习题 外 , 我 们 还 建议 学 生 在 leetcode @ 上 刷 题 。leetcode 上 的 题目 





Dhttps://leetcode.com/ 
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不 是 国际 计算 机 学 会 (ACM) 的 竞赛 题目 , 而 是 各 大 IT 企业 的 面试 题目 。 通 过 解 题 不 仅 
能 提高 学 生 算法 设计 的 能 力 , 也 对 编程 能 力 有 极 大 提高 。 

阅读 本 书 需 要 学 生 能 按照 教程 (http://www.python.org/) 配置 Python 环境 , 知道 
如 何 写 一 个 简单 的 包括 循环 的 函数 。 因 此 , 该 课程 安排 在 学 生 上 过 一 门 程序 语言 课程 之 
后 较为 合适 。 
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本 章 学 习 目 标 
。 掌握 算法 的 定义 
。 掌握 算法 效率 的 基本 概念 
。 了 解 求解 问题 可 能 存在 效率 不 同 的 算法 


1.1 算法 的 定义 


算法 的 英文 Algorithm 来 自 于 一 位 叫 al-Khwarizmi 的 波斯 数学 家 。 他 在 大 约 公元 前 
825 年 , 写 了 一 本 叫 Om the Calculation with Hindu Numerals 的 书 , 该 书 主要 列举 了 加 、 
减 、 乘 、 除 和 计算 圆周 率 数 值 的 计算 方法 。 该 书后 被 翻译 成 拉丁 文 Algoritmi de numero 
Indorum， 英文 的 Algorithm 就 来 自 拉 丁 文 Algoritmi。 
什么 是 算法 ? 简单 地 说 , 算法 就 是 按照 一 定 步 又 解决 问题 的 办 法 。 这 个 定义 里 面部 
含 了 算法 的 两 个 重要 属性 : 一 个 属性 是 ,算法 一 般 包括 一 系列 有 限 的 步骤 , 这些 步 又 能 
快速 完成 ; 另 一 个 属性 是 , 算法 要 能 正确 地 给 出 具体 问题 的 解 。 
“ 民 以 食 为 天 ”， 下 面 通过 一 个 与 我 们 日 常生 活 息 息 相 关 的 例子 来 说 明 算法 的 这 两 
个 属性 。 红烧 肉 是 中 国 一 道 非常 经 典 的 家 常 菜 看, 训 制 红烧 肉 的 过 程 就 可 以 总 结 为 一 个 
算法 。 这 个 算法 的 输入 是 五 花 肉 和 各 种 调料 , 如 葱 、 姜 、 菏 、 效 油 和 糖 等 , 输出 当然 就 是 
口 诱 人 的 红烧 肉 (如 图 1.1)。 根 据 输 入 ,， 毫 制 这 道 菜 看 的 步骤 包括 : 
。 五 花 肉 洗 净 , 切 4cm 见方 的 块 备用 
。 欧 切 大 段 、 姜 切片 、 薪 剥 好 备用 
e 用 纱布 将 大 料 、 花椒 、 桂 皮包 好 封 好 口 备用 
。 锅 中 做 少许 油 , 凉 油 时 下 入 白糖 用 铲子 慢 慢 炒 制 
。 锅 中 的 糖 变 成 深 红色 时 亮 入 桨 油 ,， 下 入 切 好 的 五 花 肉 
。 不 停 地 炉 炒 五 花 肉 至 糖色 右 匀 并 微微 出 油 
e 下 入 60?C 左右 的 温水 至 刚好 没 过 肉 
。 下 料酒 、 放 入 香料 包 后 大 火 做 开 
。 盖 盖 改 小 火 慢 慢 炖 五 花 肉 至 9 成 熟 
。 入 盐 和 少许 糖 调味 后 继续 烂 五 花 肉 至 松软 入 味 
e 捡 去 香料 包 , 大 火 将 汤 汁 收 到 红 亮 浓 稠 即 可 出 锅 食用 





到 
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以 上 制作 红烧 肉 的 步骤 就 是 一 个 算法 。 首先, 以 上 步骤 针对 的 是 “如 何 训 制 红烧 肉 ” 
这 一 具体 问题 。 其 次 , 解决 这 个 问题 包括 一 系列 特定 的 步骤 ,比如 什么 时 候 加 水 , 什么 时 
候 加 料酒 等 。 根据 这 些 步骤 , 大 家 都 能 做 出 色 、 香 、 味 差别 不 大 的 红烧 肉 。 








图 1.1 豪 制 红烧 肉 示意 图 


当然 ,除了 以 上 这 两 个 重要 的 属性 外 ,我 们 还 可 以 发 现 亮 制 的 步骤 数 是 有 限 的 ， 且 
整个 就 制 时 间 大 约 需 要 一 小 时 左右 。 对 于 一 道 普 通 家 庭 常 常 襄 制 的 菜肴 而 言 , 一 小 时 是 
可 以 接受 的 。 如 果 一 道 菜 的 毫 制 时 间 需 要 一 天 或 者 是 一 个 月 ， 那 么 它 就 很 难 成 为 流行 的 家 
常 菜 看 。 也 就 是 说 ， 一 个 算法 除了 能 解决 问题 ,还 要 能 在 一 个 合理 的 时 间 内 得 到 它 的 解 。 

此 外 , 我 们 描述 这 个 “ 训 制 红烧 肉 ” 算 法 采用 的 是 自然 语言 。 也 许 读者 会 对 此 有 些 
疑问 ， 认 为 算法 都 是 用 计算 机 程序 设计 的 语言 , 如 大 家 熟悉 的 C++ 、Java 等 来 描述 。 其 
实 , 是 否 是 算法 和 采用 什么 语言 来 描述 并 没有 直接 的 关系 。 只 要 描述 算法 的 语言 能 让 读 
算法 的 人 看 懂 , 哪怕 是 自然 语言 也 能 定义 一 个 算法 。 

以 上 例子 告诉 我 们 , 算法 并 不 神奇 , 我 们 日 常 的 生活 就 会 遇 到 各 种 算法 。 当 然 , 算法 
还 有 其 他 更 为 严谨 的 定义 , 我 们 并 不 准备 一 一 列举 这 些 定 义 , 下 面 将 从 算法 的 两 个 重要 
属性 来 进一步 讨论 它 。 


1.1.1 ”算法 的 属性 


本 书 所 讨论 的 是 计算 机 领域 内 的 算法 , 也 就 是 说 解决 问题 的 类 型 是 计算 问题 。 这 种 
情况 下 , 算法 是 一 个 定义 明确 的 计算 过 程 ,可 以 以 一 些 值 或 一 组 值 作为 输入 , 产生 一 些 
值 或 一 组 值 作为 输出 。 因 此 , 算法 也 可 以 说 是 将 输入 转 为 输出 的 一 系列 有 限 计算 步骤 。 
比如 , 前 面 红 烧 肉 的 例子 中 , 输入 就 是 五 花 肉 和 各 种 配料 , 输出 当然 是 如 图 1.1 右 图 所 示 
的 红烧 肉 。 

算法 的 第 一 个 重要 属性 就 是 正确 , 也 就 是 说 能 正确 的 求解 问题 。 对 于 一 个 不 能 得 到 
问题 正确 解 的 算法 , 不 管 这 个 算法 设计 得 多 么 有 技巧 , 具有 何 种 奇 思 妙 想 ， 对 给 定 的 问 
题 而 言 都 没有 意义 。 比 如 , 现在 的 问题 是 亮 制 红 烧 肉 ， 但 是 给 出 的 算法 却 只 能 毫 制 出 糖 
醋 里 宥 ,显然 给 出 的 这 个 算法 对 于 京 制 红烧 肉 这 一 问题 而 言 没 有 意义 。 因 此 , 设计 某 个 
问题 的 算法 和 分 析 该 算法 的 前 提 , 就 是 该 算法 要 能 求解 出 该 问题 的 正确 解 。 
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在 某 些 情况 下 , 我 们 也 能 接受 在 一 定 概率 下 获得 的 正确 解 。 比 如 我 们 常用 的 RSA 公 
钥 加 密 算法 中 ， 需 要 确定 给 定 大 数 (如 数 百 位 长 度 ) 是 否 为 素数 。 三 位 MIT 的 教授 设 
计 了 一 个 非常 高 效 的 算法 来 判断 一 个 大 数 是 否 为 素数 , 但 是 判断 结果 并 不 总 是 正确 , 即 
存在 误 判 。 也许 读者 会 认为 , 既然 RSA 算法 并 没有 得 到 正确 解 ,怎么 它 依然 是 加 密 算 法 
中 最 重要 的 算法 呢 ， 甚 至 这 三 位 发 明 人 还 因为 这 个 算法 获得 了 2002 年 的 图 灵 奖 ? 这 是 
因为 , 尽管 存在 误 判 ,但 这 个 误 判 出 现 的 概率 异常 低 一 一 大 约 千 万 亿 次 才 出 现 一 次 。 因 
此 , 获得 正确 解 也 可 以 允许 算法 出 错 , 只 要 这 个 出 错 的 概率 在 我 们 可 以 控制 的 范围 内 就 
可 以 〈 见 第 11 章 )。 

此 外 , 为 了 在 合理 时 间 得 到 有 些 问 题 的 解 , 我 们 往往 会 放弃 获得 精确 正确 解 的 可 
能 , 而 是 尝试 得 到 该 问题 的 一 个 近似 的 正确 解 。 近似 算法 求解 的 问题 一 般 属于 NPC 问 
题 (12.3.4 节 ), 这 些 问题 目前 没有 多 项 式 时 间 算 法 可 以 求解 它们 的 最 优 解 , 但 通过 近似 
算法 可 以 在 多 项 式 时 间 求 得 一 个 次 优 解 。 

算法 的 另 一 个 重要 属性 就 是 快速 。 快速 意味 着 对 于 一 个 问题 , 可 能 存在 用 不 同 的 算 
法 都 能 得 到 正确 的 解 , 但 其 中 有 的 算法 速度 更 快 。 我 们 希望 找到 那个 速度 最 快 的 算法 。 

追求 更 快 的 速度 ,是 受 人 类 本 能 的 驱使 人 类 科学 技术 的 一 个 驱动 力 就 是 追求 速度 
的 极致 。 这 里 的 速度 含义 广泛 , 比如 要 做 到 真正 的 “ 朝 辞 白 帝 彩云 间 , 千里 江陵 一 日 还 ”， 
我 们 现在 有 了 汽车 、 火 车 、 高 速 列车 (图 1.2) 和 飞机 等 交通 工具 。 杜甫 的 “烽火 连 三 月 ， 
家 书 抵 万 金 ”， 表达 了 快速 和 远方 亲人 取得 联系 的 遐思 。 现在 的 微 信 、 电 话 和 各 种 视频 通 
信和 软件 , 真正 实现 了 人 们 快速 通信 的 愿望 。 当 然 , 算法 还 有 许多 其 他 的 属性 ， 比 如 简洁 、 
通用 和 模块 化 等 。 本 书 重点 关注 的 就 是 正确 和 快速 这 两 个 属性 。 

















图 1.2 高 速 列车 


1.1.2 ”效率 的 定义 

快速 是 衡量 算法 效率 的 一 个 重要 属性 。 对 于 算法 效率 , 除了 包括 算法 的 运行 时 间 ， 
也 会 包含 算法 执行 过 程 中 所 占用 的 计算 空间 。 在 实际 的 分 析 过 程 中 , 往往 假定 算法 效率 
是 待 处 理 问 题 输入 规模 n 的 函数 。 还 是 以 毫 制 红烧 肉 为 例 ， 当 输入 从 2.5 千克 五 花 肉 增 








@ RSA 为 该 算法 三 位 发 明 人 姓氏 首 字母 , 他 们 分 别 是 Ron Rivest、 Adi Shamir 和 Leonard Adleman 
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加 到 25 千克 五 花 肉 ， 显 然 所 需要 的 亮 制 时 间 会 增加 。 随 着 输入 规模 的 增加 , 毫 制 时 间 
了 可 能 增加 5 倍 、10 倍 或 是 没 变 。 这 个 增长 趋势 被 称 为 算法 的 时 间 复 杂 度 。 

对 于 计算 算法 的 时 间 复 杂 度 ,也 许 读者 认为 只 需要 取 一 系列 不 同 规模 的 输入 数据 在 
机 器 上 运行 算法 , 得 到 各 个 输入 数据 的 算法 运行 时 间 即 可 。 比 如 , 可 以 取 输 入 规模 n 分 
别 等 于 50、500、5000 这 三 组 数据 , 然后 分 别 求 出 这 三 组 输入 数据 对 应 的 时 间 , 就 可 以 得 
到 算法 的 时 间 复 杂 度 。 然而 , 这 种 直观 的 计算 存在 两 点 不 足 : 

。 这 种 计算 将 依赖 于 算法 所 运行 机 器 的 性 能 。 运算 算法 的 机 器 硬件 配置 可 能 不 同 ， 

如 CPU、 内 存 等 , 这 导致 得 到 的 计算 时 间 也 不 一 样 。 比 如 说 , 对 于 某 个 问题 , 张 
某 和 李 某 两 人 各 自 提出 了 两 个 不 同 的 算法 。 张 某 的 算法 在 他 的 机 器 上 耗 时 为 5s， 
而 李 某 的 算法 在 其 机 器 上 耗 时 为 100s。 这 时 , 我 们 并 不 能 得 出 张 某 的 算法 效率 要 
优 于 李 某 这 一 结论 。 因 为 ， 他们 各 自 算法 的 运算 时 间 是 在 不 同 的 机 器 上 得 到 的 。 
这 就 好 比 他 们 测量 时 用 的 尺 的 刻度 不 一 样 。 那 读者 会 想 , 如 果 用 同一 台 机 器 运算 
他 们 的 算法 , 不 就 可 以 比较 了 吗 ? 用 同一 台 机 器 依然 会 造成 算法 分 析 的 困难 ,如 
选用 的 程序 语言 , 编程 技巧 等 都 会 造成 两 个 算法 运行 时 间 的 差异 , 然而 这 种 差异 
并 不 是 由 于 算法 本 身 的 差异 造成 。 因此 , 算法 效率 的 度量 不 应 该 受 算法 所 运行 的 
机 器 、 实 现 算法 的 程序 语言 和 编程 技巧 等 因素 影响 。 
以 上 计算 方式 并 不 能 回答 当 输 入 规模 n 没有 落 在 其 给 定 范围 时 的 算法 效率 。 比 
如 , 当 n = 1000 时 , 算法 运行 时 间 可 能 是 以 分 钟 计 , 似乎 这 个 效率 可 以 接受 。 但 
是 , 当 n = 10000 时 , 算法 的 运行 时 间 也 许 就 是 按 年 计 了 。 因 此 , 通过 采样 输入 
规模 并 不 能 确定 算法 的 时 间 效 率 , 算法 时 间 复 杂 度 的 函数 应 该 连续 。 

为 了 克服 以 上 困难 , 就 需要 引入 算法 的 渐进 分 析 法 。 当 采用 渐进 分 析 时 ,往往 假定 
输入 规模 n 趋向 无 穷 大 。 将 输入 规模 扩展 到 无 穷 大 , 再 来 量化 算法 效率 这 一 想法 ,是 算 
法 分 析 最 为 重要 的 一 个 思想 。 这 样 做 的 好 处 是 , 不 仅 能 得 到 一 个 算法 运行 时 间 的 连续 函 
数 , 而 且 其 计算 结果 与 算法 运行 的 硬件 配置 无 关 、 与 实现 算法 的 程序 设计 语言 无 关 、 与 
程序 设计 语言 的 编译 环境 无 关 (我 们 将 在 2.3 节 详 细 介 绍 渐 进 分 析 法 )。 比 如 , 一 个 算法 
执行 时 间 为 35n 十 102。 当 n > 4 时, 35n 相对 于 102 对 算法 时 间 有 更 大 影响 。 随 着 ” 逐 
渐 增 大 , n 就 成 为 影响 算法 执行 的 主要 因素 。 当 趋向 无 穷 大 时 ，35m 十 102 就 可 以 写 
作 O(n), 意味 着 算法 执行 时 间 与 输入 规模 呈 线 性 关系 。 时间 函数 35n 十 102 中 的 低 次 项 
102 和 系数 35 在 算法 时 间 复 杂 性 度量 时 被 去 除 , 是 因为 它们 可 能 是 由 机 器 配置 、 实 现 语 
言 或 者 编译 器 版 本 等 因素 造成 ,而 这 些 都 不 是 影响 算法 执行 时 间 的 主要 因素 。 

执行 时 间 函 数 35n + 102 被 记 为 O(n), 其 中 的 记号 O( 读 作 大 欧 ) 表示 算法 执行 时 
间 的 度量 函数 。 比 如 一 个 算法 的 时 间 复 杂 度 为 O(n)。 这 意味 着 , 当 输 入 规模 n== 100, 其 
运行 时 间 为 了 ; 那么 当 输 入 规模 增加 到 = 1000 时 , 其 运行 时 间 则 为 10 x T, 这 表示 这 
个 算法 的 时 间 复 杂 度 随 着 输入 规模 呈 线 性 变化 。 也 就 是 说 ,， 当 输入 规模 增加 时 , 算法 运 
行 时间 也 会 增加 , 但 增加 的 量变 化 不 大 。 再 比如 , 另 一 个 算法 的 时 间 复 杂 度 为 O(2")， 则 
该 算法 时 间 复 杂 度 随 着 输入 规模 呈 指 数 变 化 。 这 意味 着 如 果 输 入 规模 增加 一 点 点 , 算法 
运行 时 间 就 会 发 生 急 剧 的 增加 。 
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这 里 我 们 先 给 出 一 个 简单 的 关于 算法 效率 的 度量 。 如 果 算 法 的 时 间 复 杂 度 随 着 输 
入 规模 n 呈 多 项 式 规模 变化 ， 那 我 们 认为 从 效率 来 说 , 这 是 一 个 可 以 接受 的 算法 。 形 如 
O(logn)、O(n)、O(nlogn) 9、O(mn?)、O(m3) 的 都 是 多 项 式 时 间 复 杂 度 。 若 算法 时 间 复 
杂 度 是 O(2")、O(1.5")、O(e?) 等 , 则 称 它们 是 指数 时 间 复 杂 度 算法 。 对 于 指数 时 间 复 杂 
度 算法 , 我 们 认为 这 是 一 个 糟糕 的 算法 (如 图 1.3) 。 


n 好 


logn 非常 好 


T(n) 





n 


图 1.3 三 个 典型 的 时 间 复 杂 度 函数 


1.2 ”算法 设计 与 分 析 举 例 


前 节 给 出 了 算法 的 定义 , 也 介绍 了 算法 效率 。 那 么 对 于 一 个 具体 的 问题 而 言 , 真 的 
可 以 通过 设计 从 而 得 到 一 个 相对 高 效 的 算法 吗 ? 下 面 将 通过 两 个 具体 的 例子 来 介绍 的 确 
存在 设计 技巧 , 可 以 得 到 更 为 快速 的 算法 。 


1.2.1 “寻找 局 部 高 点 -1D 


设想 ,2046 年 ,地球 宇 航 员 登陆 了 类 地 球 行星 HD85512b。 但 是 因为 意外 , 登陆 的 
宇宙 飞船 已 经 损毁 , 只 剩 下 一 辆 运输 车 。 宇 航 员 需 要 找到 一 处 水 源 地 来 补充 给 养 ， 由 于 
登陆 的 地 点 在 该 行星 的 一 片山 区 , 他 必须 坐 着 运输 车 在 这 片山 区 寻找 水 源 地 。 假设 该 行 
星 的 水 源 一 般 都 出 现在 山头 。 那么 , 他 该 如 何 快速 找到 水 源 地 呢 ? 

为 了 设计 算法 解决 以 上 问题 , 我 们 首先 需要 将 该 问题 转化 成 一 个 计算 问题 。 也 就 是 
将 问题 形式 化 描述 , 尤其 是 需要 量化 问题 的 输入 与 输出 。 该 问题 可 以 看 作 是 及 n 个 数 
据 的 输入 序列 A[0], A[], …, Am 一 ,每 一 个 数据 A[fi] 的 索引 i 对 应 于 山区 的 一 个 采 
样 点 , 数据 的 值 就 是 该 采样 点 的 海拔 。 输出 为 局 部 高 点 的 索引 i 该 点 须 满 足 Ali 一 1]< 
A[<A[i+1]。 为 了 便于 计算 , 我 们 假设 序列 以 外 的 海拔 为 负 无 穷 , 即 A[ 一 1] = Al[n] = 一 00。 

如 图 1.4 所 示 ,， A[2] 和 A[5] 都 是 满足 条 件 的 局 部 高 点 。 注意 题目 要 求 返回 的 是 一 个 
局 部 高 点 ， 而 不 是 最 高 点 。 此 外 , 这 个 局 部 高 点 是 整个 输入 序列 中 的 任意 一 个 。 图 1.4 中 
的 输入 序列 , 返回 ;= 2 或 者 i= 5 都 是 正确 的 解 。 


1. 简单 的 算法 
于 存在 边界 条 件 A[-1 = A[n] = -co, 因此 任意 输入 序列 至 少 存在 一 个 局 部 高 


@ 本 书 中 除非 特别 说 明 , 所 有 的 对 数 均 以 2 为 底 。 
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司 轩 二 医 胡 区 到 攻 : 
A |1|2 5 


图 1.4 局 部 高 点 


























点 。 比如, 输入 序列 是 一 个 连续 递增 序列 , 那么 最 后 一 个 元 素 就 是 局 部 高 点 。 读者 可 以 自 
行 证 明 这 个 结论 。 

求 局 部 高 点 问题 有 一 个 简单 直接 的 算法 , 就 是 从 第 一 个 元 素 开始 , 判断 其 是 否 满足 
局 部 高 点 的 条 件 。 如 果 满 足 则 返回 该 数 的 索引 ,否则 判断 下 一 个 元 素 。 如 此 循环 地 判断 
输入 序列 的 每 一 个 元 素 直 到 找到 一 个 局 部 高 点 为 止 。 

该 算法 非常 简单 , 那么 怎么 分 析 这 个 算法 时 间 复 杂 度 呢 ? 粗略 地 看 ， 似 乎 算法 运行 
的 快慢 与 局 部 高 点 在 序列 中 的 位 置 有 关 。 因 为 , 这 个 高 点 有 可 能 在 序列 的 第 一 个 位 置 就 
出 现 , 也 有 可 能 在 最 后 一 个 位 置 出 现 。 如 果 局 部 高 点 在 第 一 个 元 素 就 出 现 , 那么 算法 执 
行 一 次 比较 就 能 得 到 结果 , 这 是 最 好 情况 下 的 执行 效率 。 算法 分 析 时 基本 不 会 将 最 好 情 
况 下 的 时 间 效 率 作为 评价 算法 效率 的 标准 。 原因 非常 简单 , 我 们 并 不 能 保证 每 一 次 处 理 
的 输入 序列 总 能 满足 最 好 情况 的 条 件 , 即 第 一 个 元 素 总 是 满足 条 件 的 局 部 高 点 。 

如 果 局 部 高 点 在 最 后 一 个 元 素 才 出 现 , 那么 算法 需要 执行 n 次 计算 才能 得 到 结果 
这 是 最 坏 情况 下 的 执行 效率 。 需 要 强调 的 是 , 在 最 坏 情况 下 的 算法 时 间 复 杂 度 ， 可 以 用 
来 表征 算法 的 效率 @. 因此, 该 算法 的 时 间 复 杂 度 (mn) = O(n)。 

2. 更 好 的 算法 

前 一 个 算法 直观 , 容易 实现 , 但 并 不 是 最 优 的 算法 。 现在 考虑 改进 以 上 算法 , 改进 的 
思路 是 减少 查找 次 数 。 由 于 题目 要 求 的 是 找到 任意 一 个 高 点 , 这 意味 着 并 不 一 定 需 要 扫 
描 整 个 输入 序列 , 而 只 需要 尽快 确定 任意 一 个 高 点 所 在 位 置 即 可 。 为 了 提高 查找 的 效率 ， 
首先 需要 确定 从 序列 的 哪个 位 置 开始 查找 , 然后 再 确定 查找 的 范围 。 

究竟 从 序列 的 哪个 位 置 开始 查找 呢 ? 一 个 合理 的 选择 就 是 从 序列 的 中 间 位 置 开始 查 
找 。 这 是 因为 如 果 序 列 中 存在 一 个 高 点 , 它 要 么 是 序列 中 间 的 这 个 元 素 , 要 么 在 中 间 元 
素 左边 部 分 的 序列 , 要 么 在 中 间 元 素 右边 部 分 的 序列 。 如 果 高 点 就 在 序列 中 间 位 置 ， 那 
么 就 只 需要 一 次 查找 。 如 果 高 点 不 在 中 间 位 置 ,只 要 能 确定 高 点 是 在 中 间 元 素 左边 或 右 
边 部 分 的 序列 , 就 可 以 在 执行 一 次 查找 后 , 缩小 一 半 的 搜索 范围 。 也 就 是 说 , 执行 一 次 查 
找 要 么 很 幸运 找到 高 点 , 要 么 可 以 缩小 下 一 次 搜索 的 范围 。 

当 确 定 从 中 间 元 素 开 始 查 找 后 ,下 面 需 要 考虑 的 就 是 一 旦 中 间 元 素 不 是 高 点 , 那 能 
否 马 上 确定 高 点 的 搜索 范围 ? 可 以 根据 中 间 元 素 与 其 相 邻 元 素 大 小 关系 来 确定 高 点 的 搜 
索 范 围 。 如 图 1.5, 假设 中 间 元 素 索 引 为 i = n/2， 比较 中 间 元 素 与 其 相 邻 元 素 大 小 关系 
后 存在 以 下 三 种 情况 : 

(1) Ai] 满足 局 部 高 点 的 条 件 , 即 Ali 一 1]< A[] < AEi 十 4], 则 返回 i (如 图 1.5(a))。 








@ 本 书 以 后 在 未 作 特别 说 明 的 情况 下 , 均 采 用 最 坏 情况 下 的 时 间 复 杂 度 度量 算法 效率 。 
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Ali-1] Ali] At Ali-] Al Ali] A[it1] 


(a) (b) (¢) 
图 1.5 三 种 条 件 示 意图 


(2) 如 果 A 四 < AE 一 习 , 在 输入 数组 的 左 半 部 分 一 定 存 在 一 个 局 部 高 点 , 这 是 因为 
A 往 左 边 有 上 升 趋势 。 因此 ,下 一 次 需要 搜索 的 序列 就 是 A[0], A[,…, AE 一 熙 (如 
图 1.5(b))。 

(3) 如 果 A 国 < A[i 二 中, 在 输入 数组 的 右 半 部 分 一 定 存在 一 个 局 部 高 点 (原因 同 
(2)), 下 一 次 需要 搜索 的 序列 则 是 A[i+]], A[i+2],…, A[n 一 1] (如 图 1.5(c))。 
由 于 是 找到 一 个 高 点 , 因此 在 做 出 一 次 比较 后 , 就 可 以 缩小 一 半 的 搜寻 范围 ,只 需 
在 剩余 的 序列 中 寻找 可 能 的 高 点 。 比 如 ,初始 情况 下 输入 元 素 个 数 为 n, 经 过 一 次 比较 
可 以 确定 的 是 局 部 高 点 要 么 在 输入 序列 的 左 半 部 分 , 要 么 在 右 半 部 分 ©, 那么 , 下 一 次 需 
要 查找 的 元 素 大 小 就 变 成 了 n/2。 对 这 n/2 个 元 素 , 执行 与 以 上 相似 的 计算 , 即 选 择 这 
n/2 个 元 素 中 的 中 间 元 素 开始 查找 。 经 过 第 二 次 查找 后 , 要 么 幸运 地 找到 高 点 , 要 么 可 
以 将 搜索 范围 缩小 至 n/4 (n/2 的 一 半 )。 依 此 过 程 进行 查找 , 直到 找到 输入 序列 的 一 个 
高 点 为 止 。 

那么 ,该 怎么 分 析 以 上 算法 的 时 间 复 杂 度 呢 ? 如 图 1.6 所 示 的 序列 , 不 妨 将 该 序列 想 
象 成 长 度 为 的 蛋糕 。 经 过 第 一 次 比较 后 , 将 长 为 n 的 蛋糕 一 分 为 二 , 长 度 变 为 n/2。 经 
过 第 二 次 比较 , 长 度 为 mw/2 的 蛋糕 变 成 长 度 为 n/4。 由 于 序列 一 定 存在 一 个 高 点 , 所 

















输入 序列 序列 长 度 切 分 次 数 
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图 1.6 算法 分 析 示 意 








人 @ 不 考虑 最 好 情况 , 即 经 过 一 次 比较 马上 就 得 到 解 的 情况 。 
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以 最 坏 情 况 下 不 妨 设 需要 切 分 有 次 , 此 时 剩 下 最 后 一 个 元 素 , 该 元 素 必 是 序列 中 的 
一 个 高 点 。 那么 , 可 以 得 到 n/2* = 1, 等 式 两 边 取 以 2 为 底 的 对 数 , 得 k= logn。 因 
此 , 该 算法 最 坏 情 况 下 需要 运行 的 次 数 为 logn, 也 就 是 说 改进 后 算法 的 时 间 复 杂 度 为 
Ts(n) = O(logn)。 

如 果 = 1000, 这 两 个 算法 的 运行 时 间 没 有 显著 区 别 ( 机 器 配置 为 CPU:i7, 内 
存 :8G), 大 约 都 是 0.1ms。 但 是 , 当 n = 1000000 时 , 前 一 个 算法 大 约 需 要 运行 13s, 而 
改进 后 的 算法 所 需 时 间 大 约 为 0.001s。 也 就 是 说 , 新 的 算法 在 输入 规模 较 大 时 ， 其 效率 
相 比 较 于 第 一 个 简单 算法 有 显著 提高 。 








1.2.2 ”图 书 管理 


一 个 现代 化 的 图 书馆 , 不仅 需 要 馆藏 丰富 , 还 需要 能 为 读者 提供 快速 查找 图 书 的 服 
务 。 不 妨 假设 图 书馆 共 能 摆 放 1 万 本 图 书 , 也 就 是 有 1 万 个 书 位 供 使 用 。 那么 , 随 着 这 
家 图 书馆 不 断 的 进 书 , 管理 员 该 如 何 来 摆 放 图 书 ， 从 而 可 以 为 读者 提供 快速 查找 图 书 的 
服务 呢 ? 
1. 按 到 序 摆 放 
-个 简单 的 摆 放 原则 就 是 按照 书 进入 图 书馆 的 顺序 ,依次 摆 放 在 书架 上 。 如 图 1.7 
所 示 ， 当 前 购买 的 是 《昆虫 学 》 这 本 书 , 书架 的 空位 是 1010, 就 将 《昆虫 学 》 放 在 1010 
位 。 下 次 再 进 一 本 新 书 , 就 将 它 放 在 1011。 如 果 一 个 读者 借 走 了 其 中 《概率 》 这 本 书 , 那 
么 管理 员 就 将 《概率 》 这 本 书 之 后 的 所 有 书 向 左 推 一 位 。 也 就 是 说 , 书 与 书 之 间 不 留 空 
位 。 这 样 不 管 是 新 书 进 馆 , 还 是 读者 还 回 《 概 率 》 这 本 书 , 都 只 需要 将 它 放 在 现 有 书 的 最 
后 即 可 。 


帐 且 到 NAN 
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图 1.7 按 到 序 摆 放 
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按照 以 上 规则 管理 书籍 , 对 管理 员 而 言 书架 上 的 书 井井有条 。 然 而 ,如 果 一 位 读者 
想 借 《 昆 虫 学 ) 这 本 书 , 管理 员 就 必须 从 书架 的 第 一 个 书 位 开始 寻找 ,依次 比 对 书架 上 
每 一 本 书 名 , 直到 找到 《昆虫 学 》 这 本 书 为 止 。 显然 , 按照 以 上 方式 管理 图 书 , 对 于 一 个 
大 型 图 书馆 而 言 尽 管 进 书 时 书 的 摆 放 简单 清楚 , 但 对 于 找 书 这 项 工作 而 言 就 显得 费时 费 
力 。 如果 有 n 个 书 位 , 那么 按 序 摆 放 组 织 图 书 , 检索 图 书 的 耗 时 就 是 O(n), 即 检索 的 时 
间 随 着 书 位 的 多 少 呈 线性 时 间 规 模 变化 。 

2. 按 哈 希 表 摆 放 

为 了 解决 找 书 费时 的 问题 , 管理 员 在 进 得 一 本 新 书后 , 可 先 将 该 书 的 书 名 title 输入 
一 个 哈 希 函数 hash(title)， 这 个 哈 希 函数 hash 运算 后 的 输出 结果 为 书 位 的 索引 。 比 如 ， 
书 名 title= 《昆虫 学 》， 那么 hash(《 昆 虫 学 》 )=1011。 也 就 是 说 《昆虫 学 》 这 本 书 应 该 放 
在 编号 为 1011 的 书 位 。 此 时 ， 各 个 书 位 就 称 为 哈 希 表 , 如 图 1.8 所 示 。 








。 输入 : 书 名 
输出 ， 书 位 号 
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图 1.8 按 哈 希 表 摆 放 


按照 以 上 方式 摆 放 书 的 好 处 是 可 以 实现 快速 搜索 。 当 读者 提出 想 借 《 昆 虫 学 》 这 本 
书 时 ,管理 员 只 需要 将 书 名 《昆虫 学 》 输 入 至 哈 希 函数 ,得 到 1011 返回 结果 , 管理 员 就 
可 以 立即 去 书 位 1011 取得 该 书 。 显然 , 按照 哈 希 表 方式 组 织 图 书 可 以 显著 提高 检索 书 位 
的 效率 。 此 时 , 检索 的 时 间 效 率 与 书 位 的 多 少 没 有 关系 ,只 与 哈 希 函 数 的 运算 时 间 有 关 。 
哈 希 函数 的 一 次 计算 时 间 往 往 为 常数 , 因此 按照 哈 希 表 方式 组 织 图 书 , 其 搜索 的 执行 时 
间 为 0(1)。 
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O(1) 为 常数 的 执行 时 间 , 这 个 时 间 可 以 是 几 秒 或 几 分 钟 , 表示 算法 执行 时 间 不 随处 
理 数据 的 大 小 变化 。 比 如 说 ,处 理 规模 为 10 个 数据 的 时 间 是 20s, 那么 处 理 百 万 数据 规 
模 的 时 间 依然 是 20s。 

那么 哈 希 函数 到 底 采 用 什么 函数 呢 ? 显然 ， 该 函数 需要 能 将 诸如 书 名 这 样 的 字 
符 转 换 为 存储 位 置 的 索引 。 这 一 点 对 计算 机 而 言 非常 简单 ， 因 为 计算 机 内 存储 的 数 
据 对 象 其 本 质 都 是 数字 。 比 如 , “昆虫 学 ”这 个 书 名 字符 串 , 其 计算 机 内 存储 的 编码 就 
是 “\u6606\u866b\u5b66”。 那么 , 这 数字 串 该 如 何 变 成 存储 位 置 的 索引 呢 ? 这 需要 先 确 
定 存储 位 置 的 大 小 。 由 于 存储 空间 总 是 有 限 的 , 我 们 也 不 能 预先 确定 到 底 有 多 少数 据 存 
储 。 因 此 , 一 个 合理 的 方法 是 先 确定 一 个 中 等 规模 的 哈 希 表 空 间 n。 由 于 书 名 转换 为 数 
字 内 后 ， 其 大 小 可 能 超出 ”的 范围 。 这 时 哈 希 函数 就 需要 将 较 大 的 数 m 转化 为 一 个 较 
小 的 数 , 以 便 与 数字 m 对 应 的 书 名 能 在 大 小 为 n 的 哈 希 表 中 确定 其 存储 位 置 。 最 简单 的 
哈 希 函数 就 是 取 余 一 一 mod 运算 , 比如 , mod(m = 1000,n = 13) = 12。 通过 取 余 , 可 以 
将 一 个 大 数 m = 1000, 转换 为 一 个 较 小 的 数 12。 

人 
可 以 将 哈 希 表 看 作 一 个 数据 对 。 其 中 ,一 个 数据 称 为 key， 另 一 个 数据 称 为 value。 书 名 
可 以 作为 key, value 可 以 是 作者 名 、 出 版 社 、 出 版 年 份 的 集合 。 比 如 ，{ “算法 设计 与 分 
析 ”: [“ 程 振 波 ”,“ 清 华 大 学 出 版 社 ”,“2017”]}， 这 个 哈 希 表 的 key 就 是 “算法 设计 与 
分 析 ”，value 则 等 于 字符 序列 [“ 程 振 波 ”,“ 清 华 大 学 出 版 社 ”,“2017”]。 

按照 哈 希 表 存 储 的 数据 ， 可 以 通过 key 来 索引 。 比 如 申明 一 个 称 为 book 的 哈 希 
表 ， 其 中 有 两 条 数据 ，book = {“ 算 法 设计 与 分 析 ”: [“ 程 振 波 ”, “清华 大 学 出 版 
社 ”,“2017”];“ 机 器 学 习 ”:[“ 周 志 华 ”, “清华 大 学 出 版 社 ”,“2016”]}。 那 么 通过 书 名 
就 可 以 索引 到 作者 名 、 出 版 社 和 出 版 年 份 这些 数 据 , 即 book[“ 算 法 设计 与 分 析 ”]=[“ 程 
振 波 ”, “清华 大 学 出 版 社 ”,“2017”],book[“ 机 器 学 习 ”]=[ “周志 华 ”,“ 清 华 大 学 出 版 
社 ”,“2016”]。 需要 特别 强调 的 是 , 哈 希 表 中 的 key 对 应 的 数据 不 能 有 重复 。 比 如 ,book 
中 只 能 有 一 条 数据 的 key 为 “算法 设计 与 分 析 ”。 
































1.3 ”小结 


算法 可 以 简单 地 看 作 是 解决 问题 的 办 法 。 面 对 或 简单 或 复杂 的 各 种 问题 , 解决 问题 
的 办 法 可 以 是 “条 条 大 路 通 罗 马 ”。 哪怕 是 针对 相同 的 一 个 问题 , 求解 该 问题 的 算法 往往 
也 各 不 相同 , 其 运算 的 时 间 也 会 有 很 大 的 差异 。 而 为 了 得 到 高 效 的 算法 , 不 仅 可 以 通过 
与 寻找 局 部 高 点 类 似 的 改变 计算 过 程 得 到 , 也 可 以 通过 如 图 书 管理 中 介绍 的 改变 数据 组 
织 模式 得 到 。 

在 确保 算法 正确 的 前 提 下 ,如 何 筛选 出 一 个 高 效 的 算法 呢 ， 为 此 ， 就 需要 通过 渐进 
分 析 法 量化 算法 的 时 间 复 杂 度 ， 从 而 为 不 同 算法 之 间 的 取舍 建立 一 个 一 致 的 标准 。 算法 
不 是 万 能 的 , 并 不 是 所 有 的 问题 都 能 给 出 一 个 解 。 但 是 , 解决 问题 的 办 法 依然 有 迹 可 循 。 
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本 书后 面 各 章 将 通过 提炼 解决 类 似 问题 算法 的 特征 ， 帮 助 读者 建立 计算 思维 ， 从 而 提高 
读者 利用 算法 解决 计算 问题 的 能 














课 后 习题 


习题 1-1 ”现实 生活 中 的 算法 
请 给 出 至 少 两 个 现实 生活 中 使 用 算法 的 实例 。 





习题 1-2 ”算法 的 定义 
(a) 给 出 一 种 算法 的 定义 。 
(b) 列 出 至 少 三 个 算法 的 属性 。 
(ce) 渐进 分 析 法 为 什么 可 以 做 到 与 算法 运行 硬件 环境 无 关 ? 
(d) 为 什么 说 多 项 式 时 间 复 杂 度 的 算法 要 优 于 指数 时 间 复 杂 度 的 算法 ? 
习题 1-3 ”寻找 局 部 高 点 -1D 
(a) 证 明 : 给 定 任意 序列 , 一 定 存 在 一 个 局 部 高 点 。 
(b) 使 用 熟悉 的 高 级 语言 , 实现 算法 复杂 度 为 O(n) 的 寻找 一 维 局 部 高 点 的 算法 。 
(c) 使 用 熟悉 的 高 级 语言 , 实现 算法 复杂 度 为 O(logn) 的 寻找 一 维 局 部 高 点 的 算法 。 
(d) 当 输 入 规模 mn = 10000000 时 , 复杂 度 为 O(n) 的 算法 在 机 器 上 运行 的 时 间 为 
多 少 ? 
(e) 当 输入 规模 = 10000000 时 , 复杂 度 为 O(logn) 的 算法 在 机 器 上 运行 的 时 间 为 
多 少 ? 


习题 1-4 ”寻找 局 部 高 点 -2D 

某 数 如 果 大 于 等 于 该 数 上 、 下 、 左 、 右 这 四 个 相 邻 的 数 ， 则 称 该 数 为 二 维 情况 下 的 
高 点 。 给 定 大 小 为 x n 的 二 维 数组 ， 设 数组 边界 外 的 值 为 -oo, 求 给 定 二 维 数组 中 的 
任意 一 个 局 部 高 点 。 如 图 1.9 所 示 , 有 4 行 4 列 的 二 维 数组 , 图 中 深 色 方 格 内 的 数字 [10， 
20, 21] 均 为 满足 条 件 的 局 部 高 点 。 








图 1.9 2D 局 部 高 点 
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(a) 按照 二 维 情况 下 局 部 高 点 的 定义 , 给 出 一 个 复杂 度 为 O("2) 的 算法 。 

(b) 改进 以 上 算法 , 给 出 一 个 复杂 度 为 O(n1logn) 的 算法 。 
习题 1-5 ” 哈 希 表 

班级 有 10 位 同学 , 每 位 同学 的 数据 有 姓名 、 籍 贯 和 成 绩 。 请 使 用 你 最 熟悉 的 一 种 语 
言 ， 按 照 哈 希 表 存储 这 10 位 同学 的 数据 。 





第 2 章 渐进 分 析 与 Python 计算 模型 


本 章 学 习 目 标 
。 熟悉 随机 访问 机 器 模型 的 结构 
。 掌握 三 个 渐进 符号 的 定义 
。 熟练 掌握 Python 常用 函数 的 时 间 复 杂 度 
。 掌握 利用 渐进 分 析 法 分 析 复 杂 函 数 的 时 间 复 杂 度 


2.1 引言 


求解 问题 的 算法 往往 并 不 唯一 , 为 了 量化 不 同 算法 的 效率 , 就 需要 通过 渐进 分 析 的 
方法 来 计算 算法 的 时 间 复 杂 度 。 由 第 1 章 的 求 一 维 局 部 高 点 的 例子 可 知 , 通过 巧妙 地 设 
计 可 以 缩短 寻找 到 局 部 高 点 的 时 间 , 算法 的 时 间 复 杂 度 可 以 从 O(n) 提高 到 O(logn)。 
在 处 理 的 数据 规模 较 大 时 ， 时 间 复 杂 度 为 O(logn) 算法 的 效率 显著 优 于 时 间 复 杂 度 为 
O(n) 的 算法 。 

由 于 引进 了 渐进 分 析 , 大 大 简化 了 算法 时 间 复 杂 度 的 计算 。 这 是 因为 渐进 分 析 下 ， 
并 不 需要 精确 计算 算法 的 执行 时 间 , 而 只 需要 计算 时 间 函 数 在 输入 规模 增长 时 的 增长 
趋势 。 也 就 是 说 , 算法 执行 的 时 间 函 数 中 , n 的 低 次 项 和 高 次 项 前 的 常数 项 均 可 略 去 。 这 
是 因为 在 n 变 得 较 大 时 , n 的 高 次 项 决定 了 函数 的 增长 趋势 。 

为 了 简化 算法 复杂 度 的 分 析 ， 本 章 将 首先 介绍 一 个 简化 的 计算 机 模型 , 算法 可 以 在 
该 模型 上 运行 。 接 着 , 将 介绍 渐进 分 析 的 数学 定义 , 尤其 是 三 个 渐进 符号 : 上 界 O、 下 界 
Q 和 上 下 界 (又 称 确 界 )9。 最 后 , 简单 介绍 Python 的 基本 语法 , 以 及 Python 常用 函数 
和 简单 算法 Python 实现 的 时 间 复 杂 度 分 析 。 


全 





2.2 ”计算 模型 


在 进行 算法 分 析 之 前 , 需要 确定 算法 的 运行 环境 。 我 们 假定 实现 本 书 算法 的 机 器 模 
型 ,是 一 个 单 处 理 器 随机 访问 机 器 模型 (Random-Access Machine, RAM)。 可 以 将 这 个 
机 器 模型 想象 成 一 个 由 诸多 单元 构成 的 数组 (如 图 2.1 所 示 ), 每 一 个 单元 都 有 唯一 的 地 
址 编号 。 每 一 个 单元 可 以 存储 数值 元 素 , 也 可 以 存储 单元 的 地 址 。 数值 元 素 包括 整数 、 浮 
点 数 或 者 字符 串 等 基本 数据 类 型 。 实现 本 书 算法 的 指令 均 可 在 该 机 器 模型 上 运行 , 且 指 
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RAM 除了 能 够 存储 数据 ,更 为 重要 的 是 可 以 
执行 指令 。 需 要 指出 的 是 ，RAM 中 并 不 包含 如 排 
序 、 取 最 大 值 这 样 的 指令 , 这 是 因为 实际 的 计算 机 
也 并 不 包含 这 样 的 指令 。 因 此 , RAM 中 包含 的 指 
令 都 是 现代 计算 机 中 常见 的 最 基本 的 指令 。 常见 的 
指令 包括 各 种 运算 , 如 加 法 、 减 法、 乘法 、 除 法 、 取 
对 数 、 开 根 号 等 数值 运算 ; 并 、 或、 比较 等 条 件 运 
算 ; 加 载 、 移 动 、 拷 贝 等 数据 移动 运算 。 

该 简化 的 模型 可 以 在 常数 时 间 内 完成 加 载 一 个 
整数 ,也 可 以 在 一 个 常数 时 间 内 完成 数值 、 条 件 或 
” 者 移动 运算 。 如果 一 个 函数 被 调用 ， 则 会 分 配 一 

图 2.1 随机 访问 机 器 模型 用 于 执行 该 函数 的 空间 , 我 们 称 这 个 空间 为 一 个 活 
动 记录 。 函 数 执行 完成 , 这 个 空间 被 释放 。 

为 了 便于 索引 数据 , 我们 假设 RAM 中 的 数据 有 clogn 个 比特 位 ， 其 中 e 为 大 于 
等 于 1 的 常数 , n 为 输入 数据 规模 。 直 观 而 言 ， 就 是 一 个 整数 或 者 一 个 浮 点 数 ， 只 占用 
图 2.1 中 的 一 个 单元 格 。 

有 了 RAM 模型 以 及 各 指令 的 执行 时 间 , 就 可 以 分 析 在 RAM 机 器 上 运行 的 代码 的 
执行 时 间 。 对 于 包含 多 条 指令 的 算法 实现 , 需要 逐条 确定 各 个 指令 的 执行 时 间 , 将 所 有 
指令 执行 时 间 累 加 就 得 到 整个 算法 的 执行 时 间 。 

有 如 代码 2.1 所 示 的 算法 运行 在 RAM 机 器 上 ,下 面 我 们 逐条 分 析 各 个 指令 执行 时 
间 。 代码 2.1 第 2 行为 加 载 数据 , 该 指令 可 在 常数 cl 时 间 内 执行 完成 ; 第 3 行 的 判断 两 
个 元 素 大 小 的 指令 其 运行 可 在 常数 co 时 间 内 完成 ; 第 4 行 和 第 6 行 返回 指令 的 运行 时 
间 同 样 为 常数 ce 和 常数 ct。 整个 算法 的 运行 时 间 就 是 三 个 常数 时 间 相 加 ,常数 的 累加 和 
依然 等 于 常数 。 因 此 ,代码 2.1 将 在 常数 时 间 内 执行 完成 。 


























中 名 











RAM 的 一 个 单元 





代码 2.1 比较 两 数 大 小 


def compare_num(i, j): 
k=3 
E+ 时 和 
return i 
else: 


return k 





2.3 ”算法 的 渐进 分 析 


一 般 来 说 , 算法 的 执行 时 间 会 随 着 需要 处 理 数据 规模 的 增加 而 增加 。 如 果 一 个 问题 
需要 处 理 的 输入 数据 只 有 10 个 , 那么 解决 该 问题 的 不 同 算法 之 间 的 效率 并 不 会 有 显著 
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差异 。 当 问题 的 输入 数据 规模 较 大 , 不 同 算法 的 运行 时 间 的 差异 就 会 非常 显著 。 

假设 在 高 速 处 理 器 (如 因 特 尔 的 酷 害 系列 处 理 器 ) 的 机 器 上 运行 算法 。 当 输入 数据 
规模 n= 10, 那么 时 间 复 杂 度 为 O(n)、O(nlogn)、O(m?) 和 O(2") 的 算法 执行 时 间 均 
小 于 1s; 当 输 入 数据 规模 n= 50, 时 间 复 杂 度 为 O(n)、O(nlogn) 和 O(z2) 算法 的 运行 
时 间 依 然 小 于 1s, 而 时 间 复 杂 度 为 O(2") 的 算法 运行 时 间 就 是 11min; 当 n = 10000, 时 
间 复杂 度 为 O(n)、O(n1logn) 的 算法 运行 时 间 依 然 小 于 1s, 时间 复杂 度 为 O("2) 算法 的 
运行 时 间 大 约 为 2min, 时 间 复 杂 度 为 O(2") 的 算法 的 运行 时 间 则 是 按照 “年 ”来 记 的 天 
文 数字 。 这 也 是 在 1.1.2 节 我 们 说 一 个 指数 时 间 复 杂 度 的 算法 是 难以 接受 的 原因 。 当 然 ， 
如 果 问 题 输入 数据 n 的 规模 非常 小 , 指数 时 间 复 杂 度 的 算法 也 是 可 以 接受 的 。 

用 记号 T(n) 表示 算法 效率 函数 ,其 中 ”为 输入 数据 规模 ,这 表明 算法 效率 是 输入 
数据 规模 的 函数 。 当 n 变 得 很 大 , 甚至 趋向 于 无 穷 大 时 , T(n) 的 增长 只 与 函数 中 的 
高 次 项 有 关 。 这 样 在 分 析 算 法 复杂 度 时 , 就 只 需要 关注 T(n) 的 高 次 项 , 忽略 掉 它 的 低 次 
项 和 高 次 项 的 常数 ， 从 而 大 大 简化 了 分 析 时 计算 的 复杂 程度 。 

对 于 某 个 问题 , 若 存 在 两 个 不 同 的 算法 , 它们 的 效率 分 别 为 Ti(n) = ”2 和 Tb(n) = 
1.1m2 十 (n19)sin(10n 十 1.7) 十 45。 最终 选 择 哪个 算法 , 需要 考虑 这 两 个 函数 随 着 n 的 增 
加 而 发 生 的 变化 。 当 n 变 得 足够 大 时 , Ts(n) 中 的 低 次 项 、 常 数 项 相 比较 于 式 中 的 高 次 
项 n? 会 变 得 不 重要 , 也 就 是 说 高 次 项 n? 决定 了 函数 To(n) 值 的 大 小 。 因此 , 我 们 可 以 
说 当 n 趋 近 无 穷 大 时 , TT(n) 和 了 D(n) 渐进 相等 。 

如 图 2.2(a) 所 示 ， 当 n 规模 很 小 时 , TT(n) 和 DD(n) 显著 不 同 ,， 且 5(n) 的 值 均 大 
于 针 (n) 的 值 。 然而 当 n 增加 1000 倍 , TH(n) 和 (mn) 的 增长 趋势 就 变 得 接近 ， 如 
图 2.2(b) 所 示 。 因此 , 经 由 渐进 分 析 ， 当 算法 的 时 间 复 杂 度 分 别 为 (nn) 和 Ts(n) 时 , 我 
们 说 这 两 个 算法 的 效率 并 没有 显著 区 别 。 
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(a) (b) 
图 2.2 输入 规模 对 函数 的 影响 
算法 分 析 时 往往 假设 输入 规模 n 足够 大 ,甚至 趋 近 于 无 穷 大 。 这样 的 假设 , 意味 着 


我 们 关注 的 是 算法 运算 时 间 的 增长 率 , 也 就 是 , 随 着 输入 规模 的 增长 , T(n) 的 增长 
率 。 当 趋向 于 无 穷 大 时 , 决定 T(n) 增长 率 的 便 是 T(n) 中 的 高 次 项 ,从 而 可 以 忽略 
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了 T(n) 中 的 低 次 项 以 及 高 次 项 前 的 常数 项 。 这 些 低 次 项 或 者 高 次 项 前 的 常数 项 , 往往 是 
机 器 性 能 、 程序 设计 语言 的 性 能 和 编译 器 性 能 等 因素 产生 , 而 这 些 在 算法 时 间 复 杂 度 分 
f(n) = O(g(n)) a 析 中 都 是 需要 略 去 的 次 要 因素 。 

: 最 为 常见 的 渐进 符号 有 上 界 、 下 界 和 
fn) 上 下 界 (或 称 为 确 界 )。 其 中 ， 上 界 的 数学 
符号 为 O, 如 果 了 T(n) = O(g(n)), 那么 存 
2 在 大 于 0 的 数 no 和 c, 对 任意 n> no 有 
| 0 < T(n) < cg(m)。 直 观 来 看 ， 就 是 表示 在 
而 n 是 够 大 时 , g(n) 乘 以 某 个 常数 后 的 值 总 
图 2.3 上 界 函 数 示意 图 大 于 对 应 的 T(n)。 如 图 2.3 所 示 , g(n) 为 

函数 f(n) 的 上 界 。 
在 实际 的 应 用 中 , 可 以 简单 地 忽略 T(n) 中 的 低 次 项 、 常数 项 因子 。 如 式 (2.1): 





















nt+137= O(n) 

3n+42= O(n) 

m+3n—2=0(n) 

m+10n?logn— 15n = O(n3) 

2 +n? = 0O(2") 

1.1n2+ (nl?)sin(10n+1.7)+45= O(n?) 


(2.1) 


下 界 的 数学 符号 为 Q, 如 果 T(n) = Q(g(n)), 那么 存在 大 于 0 的 数 no 和 c, 对 任意 
n 之 no 有 0< cg(n) < T(n)。 直 观 来 看 , 就 是 表示 函数 在 n 足够 大 时 , g(n) 乘 以 某 个 常 
数 后 的 值 总 小 于 对 应 的 TT(n)。 

上 下 界 的 数学 符号 为 ,如果 T(n) = 6(g(n)), 那么 存在 大 于 0 的 数 no、cl 和 co， 
对 任意 另 > ro 有 0<cig(n) < T(n) < c2g(n)。 直 观 来 看 , 就 是 表示 函数 在 n 足够 大 时 ， 
对 应 的 TT(n) 值 在 g(n) 乘 以 某 两 个 常数 之 间 。 

当 T(n) = O(f(n))， 则 表示 T(n) 是 渐进 的 小 于 或 等 于 f(n) 的 增长 率 。 如 果 
了 T(n) = Q(f(n)), 则 表示 T(n) 是 渐进 的 大 于 或 等 于 f(n) 的 增长 率 。 当 T(n) = 8(f(n))， 
则 表示 T(n) 是 渐进 的 等 于 f(n) 的 增长 率 。 

如 果 一 个 算法 的 时 间 复 杂 度 T(n) = O(n), 那么 T(n) 的 上 界 也 可 以 是 O(n2)、O(na)， 
但 O(n?)、O(n3) 不 是 T(n) 近 的 上 界 。 如果 一 个 算法 其 时 间 复 杂 度 T(n) = 9B(n), 那么 该 
算法 的 上 界 就 不 能 是 @(n?) 或 8(n3)。 这 是 因为 6 表示 函数 的 上 下 界 , 当 T(n) = 8B(n) 
时 , m2 和 na 可 以 是 T(n) 的 上 界 , 但 mn 和 nm 不 是 T(n) 的 下 界 。 

渐进 符号 能 描述 一 个 函数 增长 或 递减 的 速度 。 对 算法 分 析 而 言 ， 其 执行 时 间 卫 是 输 
入 规模 的 函数 。 我 们 将 在 本 章 的 后 几 节 中 通过 实例 , 来 说 明 渐进 符号 在 算法 分 析 中 的 
应 用 。 
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2.4 Python 计算 模型 


本 书 所 有 算法 的 描述 均 采 用 Python。Python 是 一 种 面向 对 象 、 解 释 型 计算 机 程 
序 设计 语言 , 由 Guido van Rossum 于 1989 年 底 发 明 , 第 一 个 公开 发 行 版 发 行 于 1991 
年 。2015 年 7 月 , Python 有 两 个 官方 版 本 ,V2.7 和 V3.4 @ 。 本 书 代码 均 使 用 V3.4 版 
Python 编译 通过 。 

Python 语法 简洁 而 清晰 ， 具 有 丰富 和 强大 的 类 库 。 它 常 被 昵称 为 胶水 语言 ， 能 够 把 
用 其 他 语言 制作 的 各 种 模块 (尤其 是 C/C+ 十 ) 很 轻松 地 联结 在 一 起 。 众 多 开源 的 科学 计 
算 软 件 包 都 提供 了 Python 的 调用 接口 ,例如 著名 的 计算 机 视觉 库 OpenCV、 三 维 可 视 
化 库 VTK、 医 学 图 像 处 理 库 ITK。 而 Python 专用 的 科学 计算 扩展 库 就 更 多 了 ,例如 常 
用 的 科学 计算 扩展 库 : NumPy、SciPy 和 matplotlib, 它们 分 别 为 Python 提供 了 快速 数 
组 处 理 、 数 值 运算 以 及 绘图 功能 。 因 此 Python 语言 及 其 众多 的 扩展 库 所 构成 的 开发 环 
境 十 分 适合 工程 技术 、 科研 人 员 处 理 实验 数据 、 制作 图 表 , 甚至 开发 科学 计算 应 用 程序 。 

需要 指出 的 是 ， 本 节 不 是 Python 的 教程 。 入 门 的 Python 教程 ， 可 参考 
http://www.pythondoc.com/pythontutorial3/index.html。 当 然 ， Python 的 官方 文档 
https://docs.python.org/3/index.html 也 可 作为 参考 。 本 节 的 主要 内 容 是 介绍 在 描述 
算法 时 最 常用 的 Python 语法 , 以 及 涉及 这 些 语法 的 时 间 复 杂 度 分 析 。 














2.4.1 ”控制 流 语句 


-个 算法 往往 对 应 于 一 个 函数 , 对 于 复杂 的 算法 则 有 可 能 对 应 多 个 函数 。 Python 的 
函数 就 是 由 一 组 语句 组 成 , 实现 某 个 功能 的 程序 单元 。 代 码 2.2 是 实现 判断 输入 数据 范 
围 的 函数 。 其 中 , def 是 Python 定义 函数 的 关键 字 , numVerify 为 函数 名 , num 是 该 函 


代码 2.2 条 件 语句 的 示例 


def num verify (num): 
if num < 0: 
num=0 
print(' 非 负数 转换 为 01') 
elif num == 0: 
print(' 零 ') 
elif num == 1: 
print(' 等 于 1') 
else: 
print(' 大 于 1') 


return num 








@ Python 语言 每 隔 一 段 时 间 其 版 本 会 发 生 升级 , 关于 各 个 版 本 之 间 的 异同 请 参看 Python 的 官方 文档 。 
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条 件 语 句 


代码 2.2 中 包括 算法 最 常用 的 一 类 控制 语法 ， 即 条 件 判断 。 条 件 判 断 是 根据 条 件 是 
否 成 立 , 选择 执行 满足 条 件 的 语句 模块 。 代 码 2.2 的 第 2 行 是 一 个 条 件 判断 语句 ， 判 断 
传 入 的 参数 是 否 小 于 0。 如 果 该 条 件 成 立 , 也 就 是 传 入 参数 小 于 0,， 则 执行 第 3 行 和 第 4 
行 语句 , 将 num 赋值 为 0 并 由 print 打印 结果 。print 是 Python 内 建 的 输出 结果 到 屏幕 
的 函数 。 

elif 是 条 件 语句 中 列 出 其 他 条 件 的 关键 词 , 代码 2.2 第 5 行 与 第 7 行 分 别 判断 输入 
参数 是 否 等 于 0, 或 者 等 于 1。 如 果 以 上 条 件 均 不 满足 , 则 会 执行 第 9 行 else 语句 控制 块 
的 语句 , 即 第 10 行 。 最 后 , 函数 通过 return 返回 num 的 值 。Python 并 不 需要 在 函数 名 
中 显 式 确定 返回 值 的 类 型 与 返回 值 的 个 数 。 

下 面 来 分 析 函 数 numVerity( ) 的 时 间 复 杂 度 。 分 析 的 过 程 非常 简单 ,就 是 分 别 计算 
每 一 条 语句 的 时 间 , 然后 累加 各 条 语句 的 执行 时 间 以 便 得 到 函数 numVerity( ) 最 终 的 时 
间 复 杂 度 。numVerity( ) 函数 的 执行 时 间 由 两 个 部 分 组 成 : 分 别 是 条 件 判 断 的 时 间 加 上 
条 件 成 立 后 执行 其 模块 的 时 间 和 返回 语句 的 执行 时 间 。 也 就 是 


T(n) =max[(time(condl) + time(blocki)), (time(cond») 
+ time(block>)), (time(conds) + time(blocks)), (2.2) 
(time(cond4) + time(block4))] + time(return) 


其 中 , condi 对 应 第 2 行 的 条 件 判断 语句 , blocki 对 应 于 第 一 个 条 件 成 立 的 模块 , 即 
第 3 行 与 第 4 行 。 conds 对 应 第 5 行 的 条 件 判 断 语 句 ，blocks 对 应 于 第 二 个 条 件 成 立 的 
模块 , 即 第 6 行 的 语句 。conds、conda 分 别 对 应 第 7 行 、 第 9 行 的 条 件 判断 语句 ，blocks 
和 blocks 则 分 别 对 应 于 第 8 行 和 第 10 行 。time(return) 则 是 第 11 行 语句 的 执行 时 间 。 

根据 2.2 节 介 绍 的 RAM 模型 可 知 , 代码 2.2 中 的 四 个 条 件 判断 与 对 应 的 block 语句 
各 自 执 行 时 间 均 为 常数 , 常数 取 最 大 值 依然 是 常数 。 返回 语句 的 指令 执行 时 间 也 是 常数 。 
因此 , T(n) = 0O(1), O(1) 表示 常数 时 间 复 杂 度 。 需要 特别 指出 的 是 , 条 件 语句 中 时 间 复 
杂 度 的 计算 需要 计算 各 个 分 支 的 时 间 , 然后 取 其 中 时 间 的 最 大 值 作为 条 件 语 句 的 最 终 执 
行 时 间 。 之 所 以 取 最 大 值 , 是 因为 本 书 一 般 都 是 考虑 算法 最 坏 情 况 下 的 时 间 复 杂 度 。 

循环 语句 

除了 条 件 判 断 ， 另 一 个 控制 流 就 是 循环 , 可 以 说 循环 是 算法 之 瑰 。 循环 的 语法 也 非 
常 简 单 ， 当 满足 条 件 时 重复 地 执行 一 个 语句 模块 。 代码 2.3 第 6 行 到 第 8 行 所 示 的 就 是 
一 个 典型 的 循环 语句 , 它 累 加 从 变量 low 到 high 的 和 。 第 6 行为 循环 条 件 , 可 以 看 作 i 
分 别 取 序列 [low, low 十 1, …, high] 中 的 值 , 注意 range 缺 省 是 从 0 开始 索引 。 

除了 for 之 外 , while 也 可 以 实现 循环 , for 通过 循环 次 数 来 控制 循环 何 时 结束 , 而 
while 实现 的 循环 则 按照 条 件 来 设 定 循环 何 时 结束 。 不 管 是 哪 种 形式 的 循环 , 最 重要 的 
是 通过 循环 实现 某 个 计算 目标 。 而 判断 该 计算 目标 是 否 可 由 循环 完成 , 则 需要 用 到 循环 
不 变性 (Loop Invariants)。 循环 不 变性 与 程序 变量 的 等 式 有 关 ， 即 该 等 式 在 循环 开始 、 
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执行 过 程 和 结束 后 都 成 立 。 

通过 循环 不 变性 可 以 检查 写 出 的 循环 是 否 实现 了 我 们 预期 的 目标 , 即 是 否 计算 了 从 
low 到 high 的 累加 和 。 以 代码 2.3 为 例 ,其 循环 部 分 的 循环 不 变性 就 是 “变量 sumnum 
是 从 low 到 high 的 累加 和 ”。 如 果 将 它 表示 成 等 式 , 就 是 sumnum=low 十 (low 二 1) 十.… 十 
high。 该 等 式 在 循环 开始 时 , i=low， 此 时 sumnum=low。 循 环 过 程 中 ,等 式 依 然 成 立 。 
在 循环 结束 时 , i=high, 等 式 依然 成 立 。 

循环 中 除了 不 变 的 部 分 ， 当然 还 有 变化 的 部 分 。 对 代码 2.3 而 言 , 变化 的 就 是 变量 i 
和 sumnum。 i 可 以 看 作 是 循环 的 索引 ,也 就 是 索引 从 low 到 high 之 间 的 值 。 每 一 次 循 
环 i 累加 1， 比如 第 一 次 循环 i 等 于 low, 第 二 次 循环 时 i 就 等 于 low-+1。for 形式 下 的 
循环 中 , i 还 起 到 终止 条 件 的 角色 。 也 就 是 ， 当 i =high 时 , for 循环 终止 。 如 果 是 采用 
while 形式 的 循环 , 则 需要 写 出 循环 终止 的 条 件 。 

下 面 我 们 来 分 析 含 有 循环 的 函数 的 时 间 复 杂 度 。 同 样 地 , 需要 计算 每 一 个 语句 的 时 
间 复 杂 度 。 代码 2.3 第 2 行 到 第 4 行 是 一 个 条 件 体 , 不 难得 出 其 时 间 复 杂 度 为 常数 O(1)。 
循环 语句 中 的 时 间 复 杂 度 就 是 循环 次 数 乘 以 执行 一 次 循环 体 的 时 间 。 循环 体 是 一 个 加 法 
运算 , 按照 RAM 模型 可 知 该 计算 的 时 间 为 常数 。 循环 的 次 数 则 是 high-low+1。 因 此 ， 
如 果 low=0, high=n, 那么 代码 2.3 所 示 函 数 的 时 间 复 杂 度 为 O(n)。 





代码 2.3 ”循环 语句 示例 
def sum_nums(low, high): 
if high<low: 
print("error") 
return 
sumnum = 0 
for i in range(low,high+1): 
sumnum += i 


return sumnum 


2.4.2 ”数据 结构 


在 实现 算法 时 , 常常 需要 用 到 数据 结构 组 织 数 据 。 Python 内 建 了 许多 有 用 的 数据 结 
构 , 最 为 常用 的 就 是 list。 需 要 指出 的 是 ，Python 语言 的 list 本质 是 一 个 数组 ， 而 非 链 
表 。 代码 2.4 列 出 了 list 的 几 个 常用 操作 , 具体 使 用 可 见 代 码 说 明 。 
于 Python 中 list 的 实现 是 一 个 数组 , 因此 往 类 型 为 list 的 序列 a 中 添加 一 个 元 
素 a.append( ) 的 时 间 复 杂 度 为 O(1)? 。 而 往 a 中 插入 一 个 元 素 a.insert( ) 最 坏 情况 下 的 
时 间 复 杂 度 则 为 O(n), 这 是 因为 插入 元 素 会 导致 原来 list 中 数据 发 生 移动 。 得 到 a 中 元 
素 个 数 的 函数 为 len(a)。 由 于 list 中 会 记录 元 素 个 数 , 因此 len(a) 的 时 间 复 杂 度 为 0(1)。 
索引 a.index( ) 和 移 除 aremove( ) 均 需 要 在 a 中 找到 要 处 理 的 元 素 , 因此 它们 的 时 间 复 
杂 度 均 为 O(n)。 


@ 假设 a 中 元 素 个 数 为 n。 
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代码 2.4 list 使 用 示例 





>>> a = [66.25, 333, 333, 1, 1234.5] 
>>> print(a.count(333) ，a.count(66.25)，a.count('x'))  # 计算 列表 中 元 素 个 数 
210 


>>> a.insert (2, -1) # 在 a 中 2 号 位 插入 元 素 -1 
>>> a.append(333) # 将 333 插 入 到 a 的 末尾 
>>> a 

[66.25, 333, -1, 333, 1, 1234.5, 333] 

>>> a.index(333) # 获得 元 素 的 索引 

1 

>>> a.remove(333) # 移 除 指定 元 素 333 
>>> a 

[66.25, -1, 333, 1, 1234.5, 333] 

>>> a.reverse() # 将 a 中 元 素 反 向 

>>> a 

[333, 1234.5, 1, 333, -1,66.25] 

>>> a.sort() # 对 a 中 元 素 排序 

>>> a 

[-1, 1, 66.25, 333, 333, 1234.5] 

>>> a.pop() # 移 除 a 中 最 后 一 个 元 素 
1234.5 

>>> a 


[-1, 1, 66.25, 333, 333] 


在 生成 list 中 元 素 时 , 往往 需要 通过 循环 , 但 更 为 常用 的 是 列表 推导 式 。 如 需要 生 
成 序列 [0, 1, 4,9, 16, 25, 36, 49, 64, 81], 就 可 以 使 用 如 下 语句 : 

[x**2 for x in range(10)] 

以 上 语句 的 意思 就 是 分 别 取 x=0, 1,2,3, 4,5,6,7,8,9, 计算 每 一 x 值 的 平方 并 存储 
于 list 中 。 

为 了 生成 10 个 元 素 , 元 素 取 值 在 1 到 1000 间 , 可 以 使 用 如 代码 2.5 所 示 的 函数 
generate_rand_array()。 这 里 需要 先导 入 Python 的 随机 数 库 random, 代码 2.5 第 3 行 
同样 使 用 了 列表 推导 , 表示 循环 num 次 , 每 次 从 1 到 maxnum 之 间 随 机 取 整 数值 。 第 4 
行 与 第 5 行 则 是 随机 打 乱 array 中 的 数据 。 


代码 2.5 列表 推导 式 生成 随机 数组 





import random 

def generate_rand_array (num=10, maxnum=1000): 
array = [random.randint (1,maxnum) for i in range(num)] 
random. shuffle(array) # 随机 打 乱 array 中 元 素 
random.shuffle(array) 


return array 
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在 序列 中 循环 时 , 索引 位 置 和 对 应 值 可 以 使 用 enumerate( ) 函数 同时 得 到 : 

for i, Vv in enumerate(['tic', 'tac', 'toe']): 

第 一 次 循环 时 , i 等 于 0, v 等 于 'tic'。 第 二 次 循环 时 , i 等 于 1, v 等 于 'tac'。 如 果 需 
要 同时 得 到 序列 的 元 素 值 和 该 元 素 值 的 索引 , 采用 enumerate( ) 函数 遍历 序列 是 一 个 好 
的 选择 。 

除了 list, 另 一 个 常用 的 数据 结构 是 字典 , 或 者 称 为 哈 希 表 ( 见 1.2.2 节 )。 理解 字典 
的 最 佳 方式 是 把 它 看 作 无 序 的 键 : 值 对 (key:value 对 ) 集合 , 键 必须 是 互 不 相同 。 字典 以 
键 值 为 索引 , 键 值 可 以 是 任意 不 可 变 类 型 , 通常 用 字符 串 或 数值 作为 键 值 。 字典 的 主要 
操作 是 依据 键 来 存储 和 析 取 值 。 下面 是 字典 最 常用 的 一 些 操作 ， 见 代码 2.6。 

















代码 2.6 Python 字典 结构 使 用 示例 


>>> tel = {'jack': 4098, 'sape': 4139} # 构造 字典 

>>> tel['guido'] = 4127 # 添加 新 的 键 值 对 
>>> tel 

{'sape': 4139, 'guido': 4127, 'jack': 4098} 

>>> tel['jack'] # 根据 键 得 到 对 应 的 值 
4098 

>>> del tel['sape'] # 删除 一 个 键 值 对 
>>> tel['irv'] = 4127 

>>> tel 

{'guido': 4127，'irv': 4127，'jack': 4098} 

>>> list(tel.keys()) # 列 出 所 有 的 键 
['irv', 'guido', 'jack'] 

>>> sorted(tel.keys()) # 按键 进行 排序 
['guido', 'irv', 'jack'] 

>>> 'guido' in tel # 某 个 键 是 否 在 字典 中 
True 

>>> 'jack' not in tel 


False 





在 Python 实现 的 字典 结构 函数 中 , 得 到 对 应 键 值 的 value 的 时 间 复 杂 度 为 0(1)， 
删除 一 个 键 值 对 的 时 间 复 杂 度 也 是 O(1), 判断 某 个 键 是 否 在 哈 希 表 中 的 时 间 复 杂 度 依然 
是 O(1)。 这 些 操作 之 所 以 是 常数 时 间 复 杂 度 ,是 因为 哈 希 结构 的 操作 是 采用 直接 寻 址 的 
方式 实现 。 





2.5 ”算法 分 析 实 例 

我 们 已 经 知道 判断 和 循环 这 些 常见 语法 结构 的 时 间 复 杂 度 分 析 , 也 了 解 了 基本 的 数 
据 结 构 操作 的 时 间 复 杂 度 。 下 面 将 通过 几 个 典型 的 算法 ,来 说 明 如 何 使 用 渐进 分 析 法 来 
分 析 算法 的 时 间 效率 。 这里, 我们 假设 输入 序列 中 元 素 的 个 数 均 为 n。 
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2.5.1 求 最 大 值 


第 一 个 算法 是 给 定数 组 A, 得 到 数组 A 的 最 大 元 素 。 由 于 A 中 元 素 无 序 , 需要 遍历 
其 中 的 每 一 个 元 素 才能 得 到 A 中 的 最 大 值 。 因此 , 用 一 个 变量 max 记录 当前 最 大 元 素 。 
当 索 引 到 A 中 有 超过 max 的 元 素 , 则 将 该 值 赋 给 max, 算法 见 代 码 2.7。 


代码 2.7 求 最 大 值 
























































def get_max(A): 
n=len(A) 
max = A[O] 
for i in range(1，D) : 
if A[i]>max: 
max=A[i] 
return max 


下 面 来 分 析 代 码 2.7 中 函数 get-max(A) 的 时 间 复 杂 度 。 第 2 行为 计算 A 中 元 素 的 
个 数 ,并 将 它 赋值 给 变量 mn。 由 于 数组 元 素 个 数 可 以 通过 元 素 类 型 偏 移 量 得 到 ， 因此 其 
指令 在 RAM 中 的 执行 时 间 为 常数 cl。 第 3 行 的 赋值 运算 在 RAM 中 的 运行 时 间 也 是 
常数 co。 第 4 行 循 环 的 次 数 为 n 一 1, 对 索引 i 赋值 的 时 间 为 常数 ce， 其 总 时 间 的 消耗 
为 ca x (n 一 1)。 第 5 行为 循环 内 的 条 件 判断 , f 中 条 件 判 断 执 行 时 间 为 常数 cs， 共 执行 
n 一 1 次 , 因此 第 5 行 的 运行 时 间 为 ca(n 一 1)。 第 6 行 由 让 语句 控制 , 其 赋值 的 执行 时 
间 为 常数 cs。 由 于 第 6 行 是 否 执行 是 由 第 5 行 的 条 件 决定 的 ,因此 其 执行 时 间 可 写 为 





数 ce。 因此 , 代码 2.7 中 算法 总 的 运行 时 间 T(n) 等 于 
n—l 


T(n)=c1+cst+ca(n—1)+ca(n— 1)+ cs tr +ce (2.3) 
=t 


将 以 上 各 项 累加 , 不 难得 到 代码 2.7 的 时 间 复 杂 度 为 T(n) = O(n)。 








2.5.2 ”二 分 搜索 


给 定 一 个 有 序 的 序列 A, 判断 元 素 是 否 存在 于 这 个 序列 , 如 果 存在 返回 True, 否 
则 返回 False。 

以 上 问题 可 以 采用 二 分 搜索 算法 , 它 与 1.2.1 节 的 算法 相同 , 均 是 通过 设 定 查找 位 
置 来 缩小 搜索 范围 。 首先 , 将 与 A 的 中 间 元 素 进行 比较 , 如果 相等 则 返回 True。 如果 
太 比 中 间 元 素 大 , 那么 上 只 可 能 存在 于 A 中 间 元 素 的 右边 部 分 的 序列 ; 否则 存在 于 A 中 
间 元 素 的 左边 部 分 的 序列 。 也 就 是 说 , 每 次 将 元 素 上 与 A 中 的 元 素 比较 一 次 , 要 么 直接 
返回 结果 , 要 么 可 以 缩小 一 半 的 搜索 范围 。 
算法 实现 可 见 代 码 2.8。 索 引 变量 first 和 last 用 于 确定 搜索 范围 ,初始 情况 first=0 
指向 序列 的 第 一 个 元 素 , last=len(alist)-1 指向 序列 的 最 后 一 个 元 素 。 代码 中 的 循环 不 变性 
是 “kk 如 果 在 序列 中 , 那么 它 一 定 在 frst 和 last 确定 的 序列 范围 内 ”。 在 循环 开始 前 ， 该 
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不 变性 显然 成 立 。 循 环 过 程 中 : 当 小 于 序列 的 中 间 元 素 , 那么 大 只 可 能 存在 于 A 中 间 元 
素 的 左边 部 分 ,代码 的 第 11 行将 last 指向 与 中 间 元 素 相 邻 的 左边 元 素 ，first 依然 指向 序 
列 的 第 一 个 元 素 ; 当 大 大 于 序列 的 中 间 元 素 , 那么 只 可 能 存在 于 A 中 间 元 素 的 右边 部 
分 , 代码 的 第 13 行将 first 指向 与 中 间 元 素 相 邻 的 右边 元 素 ，last 则 保持 不 变 还 是 指向 最 
后 一 个 元 素 。 因 此 ， 循 环 过 程 中 大 如 果 在 序列 中 , 那么 它 一 定 在 frst 和 last 确定 的 序列 
范围 内 。 直 观 来 看 ， 随 着 循环 次 数 的 累加 , 由 first 和 last 确定 的 搜索 范围 逐渐 缩小 , 直到 
fist 大 于 last, 则 结束 循环 。 另 一 个 结束 循环 的 条 件 是 上 在 A 中 , 此 时 found 等 于 True。 


代码 2.8 二 分 搜索 





def binary_search(A, k): 
first = 0 
last = len(A)-1 
found = False 
While first<=last and not found: 
midpoint = (first + last)//2 
if A[midpoint] == k: 
found = True 
else: 
if k < AImidpoint]: 
last = midpoint-1 
else: 
first = midpoint+1 


return found 


二 分 搜索 算法 的 运行 时 间 依然 需要 计算 整个 算法 运行 步 数 总 的 时 间 消 耗 。 从 算法 的 
设计 可 知 , 算法 有 可 能 会 非常 幸运 , 只 需要 比较 一 次 就 能 直接 返回 结果 。 我 们 已 经 知道 ， 
这 是 最 好 情况 下 的 分 析 结 果 , 它 并 不 能 用 于 衡量 算法 效率 。 实 际 算法 分 析 往 往 考 虑 算法 
在 某 个 输入 情况 下 , 其 最 坏 情况 下 的 执行 时 间 。 

二 分 搜索 的 最 坏 情况 下 的 分 析 , 就 是 将 A 一 直 分 解 到 不 可 再 分 时 才能 确定 是 否 
在 A 中, 这 时 A 只 剩 下 1 个 元 素 。 不 妨 设 共 分 解 了 1 次 。 在 分 解 之 前 , 输入 序列 元 素 个 
数 为 n= n/24,1 = 0。 一 次 分 解 后 元 素 少 了 一 半 , 为 n/2 = n/2!,1 = 1。 再 次 分 解 是 在 上 
一 次 分 解 的 基础 上 , 元 素 再 少 一 半 , 即 n/4 = n/22。 分 解 到 不 可 再 分 时 , 元 素 个 数 为 1， 
也 就 是 n/2! = 1。 因此, 可 得 1= logn, 即 经 过 logn 次 分 解 后 输入 序列 的 长 度 为 1。 

代码 2.8 的 第 2 一 4 行 的 运行 时 间 均 为 常数 , 即 0(1)。 第 5 ~ 13 行 的 循环 次 数 即 
为 输入 序列 A 的 分 解 次 数 1, 循环 内 的 判断 与 赋值 的 运行 时 间 均 为 常数 。 因此 , 可 以 得 
到 二 分 搜索 最 坏 情况 下 的 时 间 复 杂 度 为 O(log n)。 





2.5.3” 子 集 和 问题 


子 集 和 问题 是 计算 机 算法 领域 里 非常 著名 的 一 个 问题 。 它 的 问题 描述 非常 简单 ， 就 
是 给 定 整数 集 , 问 是 否 存在 该 整数 集 的 一 个 子 集 , 使 得 该 子 集 元 素 的 和 为 0。 如 给 定 的 整 
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数 集合 为 [一 7, 一 3, 一 2, 5, 8]， 存在 集合 的 子 集 [一 3, 一 2, 5]， 该 子 集 和 为 0。 

一 个 简单 的 算法 是 求 出 所 有 输入 集合 A 的 子 集 , 逐一 验证 其 和 是 否 为 0。 为 了 实现 
这 个 算法 , 其 关键 是 要 能 给 出 输入 集合 所 有 的 子 集 。 为 了 要 实现 这 一 计算 , 我 们 首先 来 
确定 一 个 含有 n 个 元 素 的 集合 到 底 有 多 少 个 子 集 。 显然 , 由 于 A 中 的 每 一 个 元 素 要 么 出 
现在 子 集中 , 要 么 不 出 现 , 只 有 这 两 种 情况 。 因此 , 子 集 的 总 数 是 2"。 

不 妨 设 A 中 有 三 个 元 素 , A 的 一 个 子 集 可 以 是 只 有 第 一 个 元 素 , 另外 两 个 元 素 
都 不 在 。 如 果 用 1 表示 元 素 出 现 , 0 表示 元 素 不 出 现 , 那么 只 有 一 个 元 素 的 子 集 就 是 
[100] [010] 和 [001], 它们 分 别 表示 第 1 个 或 者 第 2 个 或 第 3 个 元 素 出 现在 子 集中 ,我 们 可 
以 列 出 A 中 所 有 子 集 的 索引 , 分 别 为 [100]4, [010]2, [001]1， [110]e, [101]s, [011]s, [119H，， 
[000]o。 其 中 , 方 括号 内 的 二 进 制 数 (如 111) 对 应 着 方 括号 右 下 角 的 十 进 制 数 (7)， 即 
1x22 二 1x21 十 1x290=7。 也 就 是 说 ,表示 元 素 是 否 出 现 的 0 和 1 组 合成 的 二 进 制 数 ， 
分 别 对 应 着 0 到 7 这 8 个 十 进 制 数字 。 
因此 , 不 难得 到 算法 的 实现 ， 见 代码 2.9。 第 3 行 的 bin(i)[2:] 是 将 i 转换 成 二 进 制 
数 。 比 如 ,bin(7)[2:] = 111, bin(4)[2:] = 100。 代码 2.9 中 的 第 7 行 是 按照 lst 的 位 数 扩 
展 m, 如 m=11, lst 的 位 数 为 5, 那么 扩展 后 m=00011。 第 8 行 则 是 根据 m 中 0 和 1 的 
分 布 取得 lst 中 对 应 位 置 的 元 素 。 比 如 ,lst=[ 一 7, 一 3, 一 2, 5, 8]，m=11,， 那么 mask(lst， 
m) 的 输出 就 是 [5, 8]。 因 此 ,函数 mask( ) 的 功能 是 将 集合 lst 的 元 素 按照 二 进 制 数 m 
中 0 和 1 的 分 布 取 得 1st 中 对 应 的 元 素 。 需要 注意 的 是 , 第 8 行 采用 了 Python 语言 中 诸 
多 高 级 的 语法 元 素 , 比如 lambda 表达 式 等 。 读者 可 以 尝试 修改 第 8 行 , 采用 常规 的 循环 
和 判断 来 实现 其 功能 。 














代码 2.9 求 子 集 和 


def subset_sum(lst, target): 
for i in range(1,2**len(lst)): 
pick = list(mask(lst, bin(i)[2:])) 
if sum(pick) == target: 
yield pick 
def mask(lst, m): 
m= m.zfill(len(lst)) # 按照 st 的 位 数 扩展 
return map(lambda x: x[0], filter(lambda x: x[1] != '0', zip(lst, m))) 





代码 2.9 有 O(2") 个 循环 ,每 一 个 循环 共有 常数 个 执行 步骤 ,每 一 个 步骤 的 执行 为 
常数 时 间 。 因 此 该 算法 的 运行 时 间 T(n) = O(2”)。 也 就 是 说 算法 是 一 个 指数 函数 的 时 间 
复杂 度 , 如 果 n = 1000, 算法 的 运行 时 间 将 是 以 “年 ”为 单位 的 天 文 数字 。 


2.6 :小结 


通过 假定 实现 算法 的 单 处 理 器 随机 访问 机 器 模型 , 让 算法 分 析 过 程 变 得 更 加 简单 。 
1 渐进 分 析 可 知 , 算法 间 效 率 的 比较 在 简化 其 计算 过 程 的 同时 依然 能 得 到 准确 的 结果 。 
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本 章 介绍 了 三 个 渐进 符号 ， 上 界 O、 下 界 Q 和 确 界 9。 一 个 算法 其 最 坏 情况 下 的 上 界 往 
往 更 容易 求 得 , 而 求 得 最 坏 情况 下 的 下 界 有 时 并 不 容易 。 因 此 , 在 算法 复杂 度 分 析 时 ， 上 
界 O 是 最 为 常用 的 。 

于 本 书 的 算法 均 由 Python 语言 描述 , 所 以 熟悉 Python 的 基本 语法 有 助 于 读者 
掌握 后 续 章节 的 内 容 。 在 算法 描述 中 ,最 为 常用 的 语法 结构 就 是 判断 与 循环 。 循 环 往往 
在 描述 算法 时 起 核心 作用 , 因此 写 出 正确 的 循环 是 算法 实现 的 关键 。 为 了 更 好 地 理解 循 
环 , 读者 应 该 能 区 分 循环 中 的 变量 和 不 变量 。 通过 分 析 循 环 不 变量 , 检验 循环 结构 是 否 
实现 了 预期 的 计算 目标 。 









































课 后 习题 


习题 2-1 ”计算 模型 
RAM 计算 模型 如 何 实现 链表 式 的 数据 结构 , 画 出 其 原理 图 。 


习题 2-2 ”渐进 分 析 

(a) 分 别 给 出 上 界 、 下 界 和 确 界 的 渐进 符号 。 

(b) 将 以 下 5 个 函数 按照 增长 率 从 小 到 大 排序 : fi(n) = n, fo(n) = 2n3, fa(n) = 
n+5x10, fan)=n?, fo(n) = n3。 

(c) 将 以 下 函数 按照 其 增长 率 从 小 到 大 排序 : fi(n) = logn, fo(n) = log(logn)， 
fa(n) = log(n?), fa(n) = log(2")。 

(d) 将 以 下 函数 按照 其 增长 率 从 小 到 大 排序 : fi(n) = 72, fo(n) = nlogn, fa(n) = 
nlogn, fa(n) = (logn)”, fs(n) = 1.0001™。 
习题 2-3 ”Python 算法 实现 

(a) 请 使 用 while, 改写 代码 2.3。 

(b) 分 别 使 用 while 和 for 实现 从 1 到 100 的 累加 求 和 。 

(c) 实现 一 个 可 以 移 除 list 中 重复 元 素 的 算法 。 

(d) 给 定 两 个 字典 结构 ,将 它们 相同 key 对 应 的 value 值 累 加 。 比 如 , 输入 分 别 是 
dl = {'a': 100, 'b': 200, 'c':300} 和 d2 = {'a': 300, 'b': 200, 'd':400}, 输出 为 {1a': 400， 
'b': 400, 'd': 400, 'c': 300} 
习题 2-4 ”二 分 搜索 

一 个 有 n 个 元 素 的 有 序数 组 A[0… nn 一 1]], 其 中 Ali]< A[i+H, i=0,1… ,n 一 1。 数 
组 A 有 可 能 包含 重复 的 数值 ， 如 : 

A=[0, 1, 1, 2, 3, 3, 3, 3, 4, 5, 5, 7, 7, 7] 

(a) 写 出 一 个 算法 L(A, z) 返回 i, 要 求 Afij> z。 比如 EL(A, 5)=9, 因为 A[9]> 5。 要 

求 给 出 的 算法 采用 二 分 搜索 。 
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(b) 证 明 算 法 中 的 循环 可 以 结束 。 
(c) 算法 中 的 循环 不 变 式 是 什么 ? 
(d) 分 析 给 出 算法 的 时 间 复 杂 度 。 
习题 2-5 “ 子 集 和 问题 
(a) 写 出 集合 A=[5, 一 2, 4, 2] 的 所 有 子 集 。 
(b) 给 出 与 本 章 不 同 的 求解 子 集 和 问题 的 算法 , 并 分 析 其 时 间 复 杂 度 。 





第 3 章 问题 求解 与 代码 优化 


本 章 学 习 目 标 
。 基本 掌握 使 用 Python 求解 较为 复杂 的 计算 问题 
。 了 解 文档 比较 问题 及 其 算法 
。 了解 单词 拼写 问题 及 其 实现 算法 
。 了解 稳 定 匹 配 问 题 及 其 实现 算法 


3.1 引言 


第 2 章 简要 介绍 了 Python 语言 最 基本 的 语法 和 常用 数据 结构 (如 列表 和 字典 )， 以 
及 如 何 分 析 简 单 算法 实现 的 时 间 复 杂 度 。 本 章 将 通过 三 个 有 趣 的 问题 , 学 习 如 何 建立 问 
题 的 计算 模型 , 并 设计 算法 求解 。 第 一 个 问题 是 如 何 比较 两 个 文档 之 间 的 相似 度 ; 第 二 
个 问题 是 如 何 检查 单词 的 拼写 错误 ; 第 三 个 问题 则 是 如 何 形成 稳定 的 匹配 关系 。 通过 完 
成 这 三 个 问题 的 算法 及 其 实现 , 帮助 读者 进一步 熟悉 使 用 Python。 

在 本 章 学 习 中 , 读者 不 仅 可 以 学 习 到 Python 语言 的 一 些 高 级 语法 , 更 重要 的 是 学 
习 对 于 一 个 具体 的 问题 如 何 得 到 其 简化 的 计算 模型 。 当 问题 转化 成 计算 模型 后 , 就 可 以 
较 容易 地 设计 算法 来 求解 它 。 此外， 本 章 还 会 继续 使 用 到 Python 中 常用 的 各 种 数据 结 
构 ， 比 如 列表 和 字典 等 。 


3.2 “文档 比较 


3.2.1 ”问题 提出 


随 着 计算 机 的 迅速 普及 ,大 学 各 类 课程 作业 往往 都 是 提交 电子 版 。 电子 版 作业 由 于 
其 格式 规范 , 字体 标准 ， 相 比较 于 传统 的 手写 作业 , 更 利于 教师 的 批改 和 保存 。 然而 , 电 
子 化 带 来 的 坏处 是 , 作业 内 容 更 容易 拷贝 和 粘贴 。 作 业 抄 袭 与 考试 作 浆 一 样 ,都 应 该 是 
严令 禁止 的 。 

假设 某 门 课程 的 教师 收 到 了 40 份 作业 , 为 了 检查 这 40 份 作业 是 否 有 相互 抄袭 , 这 
位 教师 需要 开发 一 个 软件 系统 ,能 自动 检查 各 作业 间 是 否 存 在 雷同 。 若 某 两 份 作业 雷同 
率 达 到 一 个 阔 值 , 则 认为 这 两 份 作业 有 相互 抄袭 的 嫌疑 。 因 此 , 本 章 的 第 一 个 问题 就 是 














mo nw hr 
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实现 一 个 比较 两 份 电子 文档 相似 度 的 算法 。 


3.2.2 ”算法 设计 

为 了 解决 文档 相似 度 比 较 问题 , 需要 先 将 问题 进行 形式 化 描述 。 假 设 每 一 份 作业 
即 为 一 个 文档 , 共有 n 份 文档 。 不 妨 将 每 一 个 文档 看 作 单 词 的 集合 , 也 就 是 说 忽略 单 
词 之 间 的 空格 以 及 标点 符号 。 因 此 , 文档 可 以 用 一 个 向 量 来 表示 ,向 量 的 每 一 元 素 即 
为 某 个 单词 出 现 的 次 数 。 比 如 文档 为 “to be or not to be”, 那么 表示 这 个 文档 的 向 量 
D1 = [2,2,1,1, 即 词 to 和 be 在 文档 中 均 出 现 两 次 ,而 词 or 与 not 各 出 现 一 次 。 如 果 
两 份 文档 雷同 , 那么 表示 这 两 份 文档 的 向 量 将 会 相似 。 
因此 , 以 上 问题 便 转 化 为 如 何 计算 两 个 向 量 的 相似 度 。 向 量 相似 度 可 以 通过 计算 两 
向 量 的 夹 角 来 度量 。 相似 的 文档 其 向 量 夹 角 为 0， 两 份 完全 不 一 样 的 文档 其 向 量 夹 角 为 
90°。 由 此 可 得 , 文档 相似 性 度量 的 算法 如 下 : 

(1) 将 文档 分 解 成 单词 的 集合 ; 

(2) 根据 单词 集 构建 文档 向 量 , 向 量 的 每 一 个 元 素 就 是 单词 在 文档 内 出 现 的 频率 ; 

(3) 计算 两 文档 向 量 的 夹 角 。 

下 面 将 按照 以 上 算法 , 逐步 完善 文档 比较 的 实现 。 首先 , 将 文档 从 文件 中 读 入 到 列 
表 中 ， 从 而 形成 文档 向 量 ( 见 代码 3.1)。 代 码 第 3 行为 打开 一 个 文件 名 为 flename 的 文 
件 , 第 4 行 则 是 按 行 读 取 文件 , 将 每 一 行 按 字 符 串 的 形式 存 于 一 个 列表 变量 工 中 。 如 果 
在 读 入 文件 中 存在 异常 , 将 抛 出 IOError 这 个 异常 。 由 于 需要 从 文件 逐 行 读 入 数据 ， 因 
此 该 函数 的 执行 时 间 与 文件 大 小 相关 。 











代码 3.1 读 入 文件 


def read_file(filename) : 

try: 
fp = open(filename) 
L = fp.readlines() 

except IOError: 
print ("Error opening or reading input file: ",filename) 
sys.exit() 

return L 





函数 get_words_from_string( ) 将 字符 组 合成 单词 ( 见 代 码 3.2)， 函数 的 输入 参数 
line 是 文档 一 行 中 的 字符 。 代 码 第 4 行 用 于 循环 line 中 的 数据 , 首先 通过 函数 jsalnum( ) 
检测 字符 串 是 否 由 字母 和 数字 组 成 , 将 数字 、 字 母 串 添加 于 列表 character_list 中 。 如 果 
过 到 非 数 字 或 字母 ， 则 将 character_list 中 的 字符 通过 函数 join 连接 成 word。 如 果 输 入 
串 line='a cat a 12', 那么 输出 结果 将 是 ['a', 'cat', 'a', '12']。 

如 果 一 行 的 字符 数 为 k, 代码 3.2 将 循环 次 。 循环 体内 第 8 行 的 join 方法 将 line 
中 每 一 个 字符 组 合 一 次 , 因此 第 8 行 总 的 执行 时 间 为 O(k)。 循环 体内 除 第 8 行 之 外 其 他 
语句 的 执行 时 间 均 为 常数 , 因此 代码 3.2 的 执行 时 间 为 O(k)。 





第 3 章 问题 求解 与 代码 优化 29 





代码 3.2 将 字符 组 合成 单词 





1 def get_words_from_string(line): 

2 word_list = [] 

3 character_list = [] 

4 for c in line: 

5 if c.isalnum(): 

6 character_list.append(c) 

7 elif len(character_list)>0: 

8 word = "".join(character_list) 
9 word = str.lower(word) 

10 word._list.append (word) 

11 character_list = [] 

12 if len(character_list)>0: 

13 word = "".join(character_list) 
14 word = str.lower(word) 

15 Word_list.append(word) 

16 return Word_list 


有 了 将 字符 组 合成 单词 的 函数 , 就 可 以 得 到 文档 中 的 所 有 单词 ( 见 代码 3.3)。 第 4 
行 通过 调用 函数 get_words_from_string( ) 得 到 一 行 的 单词 , 第 5 行 再 把 一 行 中 各 个 单 
词 串 存 于 word_list 中 。 

代码 3.3 只 有 一 个 一 重 循环 。 循环 次 数 即 为 文档 的 行 数 ， 假 如 文件 的 单词 总 数 
为 W， 每 一 行 有 上 个 单词 ,那么 文件 共有 WI/k 行 。 代码 3.3 第 4 行 的 执行 时 间 
为 O(k)。 第 5 行 通过 + 实现 两 个 列表 的 组 合 , 第 一 次 循环 得 到 上 个 单词 , 第 二 次 
循环 需要 组 合 两 个 大 小 为 的 列表 ， 共 循环 W/k 次 , 第 5 行 总 的 执行 次 数 等 于 
太 十 2 十 3k 十 … 十 W 二 有 (1 十 2 十 … 十 W/K)。 因 此, 代码 3.3 的 执行 时 间 为 O(W2/k)。 














代码 3.3 得 到 文档 的 单词 


def get_words_from_line_list(L) : 
word_list = [] 
for line in L: 
words_in_line = get_words_from_string(line) 


word_list = word_list + Words_in_line 


oO nn ww Np 


return word._list 





在 得 到 文档 的 每 一 个 单词 后 , 就 需要 根据 单词 列表 计算 每 一 个 单词 出 现 的 次 数 ( 见 
代码 3.4)。 在 该 实现 中 , 可 以 看 到 for 语句 还 具有 一 个 可 选 的 else 块 。 如 果 for 循环 未 被 
break 终止 , 则 执行 else 块 中 的 语句 ， 见 第 9 行 。 变 量 工 记录 当前 添加 的 单词 列表 , 第 
5 行 到 第 7 行 判 断 当 前 处 理 的 单词 是 否 存在 于 工 中 , 如果 存在 则 将 该 单词 的 出 现 次 数 
加 1。 当 输入 参数 word_list=['to', 'be', 'or', not', 'to', 'be], 那么 代码 3.4 的 输出 就 是 
[['to', 2], ['be', 2], ['or', 本 j, ['not', 1]], 即 计 算出 了 每 一 个 单词 出 现 的 频次 。 








oo om on pw nb rn 


ao nA un nn 
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当 文 档 中 的 单词 名 不 相同 ,代码 3.4 的 执行 时 间 就 是 最 坏 情况 下 的 执行 时 间 。 此 时 ， 
假设 文档 有 W 个 单词 ,那么 代码 3.4 的 执行 时 间 为 O(W?)。 


代码 3.4 计算 文件 中 每 一 个 单词 出 现 频次 





def count_frequency(word_list) : 
L=DO 
for new_word in Word_list: 
for entry in L: 
if new_word == entry[0]: 
entry[1] = entry[1] + 1 
break 
else: 
L.append([new_word,1]) 
ITeturn 工 


在 完成 了 将 文档 转换 为 向 量 后 ,下 面 就 可 以 计算 向 量 的 夹 角 ,以 便 得 到 文档 的 相似 
度 。 如果 两 向 量 分 别 为 L! 和 Ls, 其 夹 角 计 算 公 式 为 : 








LiL» LiL» 
arccos arccos (3.1) 
|LillLsl V (LiLi)(L2L2) 


代码 3.5 中 函数 inner_product( ) 计算 两 向 量 内 积 , 然后 由 代码 3.6 中 函数 vec- 
tor-angle( ) 再 计算 两 个 向 量 之 间 的 夹 角 。 


代码 3.5 计算 两 向 量 内 积 


def inner_product(L1,L2) : 
sum = 0.0 
for wordi, counti1 in L1: 
for word2, count2 in L2: 
if wordl == word2: 
sum += counti*count2 


return sum 





求 内 积 函数 有 两 个 循环 , 假设 两 个 文档 内 各 自 向 量 的 大 小 分 别 为 L1 和 Ls， 那么 该 
函数 时 间 复 杂 度 为 O(L1L2)。 需 要 注意 的 是 , 求 内 积 的 代码 3.5 中 , 只 计算 了 各 自 向 量 
相同 单词 的 积 。 如 果 对 向 量 按照 单词 字母 排序 , 那么 就 不 需要 两 重 循环 , 而 只 需要 一 重 
循环 就 可 以 实现 内 积 计算 。 


代码 3.6 计算 两 向 量 夹 角 





def vector_angle(L1,L2) : 
numerator = inner_product(L1,L2) 
denominator = math.sqrt(inner_product (L1,L1)*inner_product (L2,L2)) 


return math.acos (numerator/denominator) 
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3.2.3 ”算法 优化 

以 上 算法 尽管 可 以 实现 比较 两 文档 相似 度 的 功能 , 但 其 实现 仍然 有 许多 可 以 改进 的 
地 方 。 为 了 易于 看 出 修改 后 性 能 的 变化 , 可 以 通过 调用 import cProfile 查看 每 个 函数 占 
用 的 处 理 器 时 间 , 主 函 数 见 代码 3.7。 





代码 3.7 文档 比较 主 函数 








def main(): 

filename_1 = "tli.verne.txt" 

filename_2 = "til.verne.txt" 

sorted_word_list_1 = word_frequencies_for_file(filename_1) 

sorted_word_list_2 = Word_frequencies_for_file(filename_2) 

distance = Vector_angle(sorted_word_list_l,sorted_word_list_2) 

Print ("The distance between the documents is: %0.6f (radians)"%distance) 
i 


import cProfile 
cProfile.run("main()") 


函数 执行 后 得 到 的 输出 中 有 一 行为 ncalls:2, tottime:0.063, percall:0.032。 表 示 ， 函 
数 get_words_from_line_list( ) 的 调用 次 数 为 2, 总 的 执行 时 间 为 0.063s, 每 次 调用 时 间 
为 0.032s。 有 了 这 些 数据 , 可 便于 读者 确定 哪个 函数 是 整个 算法 的 效率 瓶颈 。 

下 面 依次 来 分 析 如 何 进 一 步 提高 以 上 实现 的 效率 。 第 一 处 修改 的 是 代码 3.3 中 用 加 
号 来 实现 连接 两 个 列表 的 操作 , 可 以 将 代码 3.3 第 5 行 改 为 


word_list.extend(words_in_ line) 


通过 十 实现 的 添加 会 生成 一 个 新 的 列表 , 然后 将 两 个 列表 中 的 元 素 添加 到 新 列表 ， 
这 样 它 的 运行 时 间 就 是 O(n 十 m)。 而 extend 方法 直接 将 m 个 元 素 的 列表 添加 到 nn 个 
元 素 的 列表 后 , 因此 其 运行 时 间 为 O(m)。 这 里 我 们 假设 第 一 个 列表 长 度 为 n, 第 二 个 列 
表 长 度 为 m。 

此 外 ,可 以 将 文档 中 的 向 量 表示 按照 其 中 的 单词 字母 顺序 进行 排序 ( 见 代 码 3.8)， 
假如 原来 代码 3.4 中 的 输出 为 [['a', 2], ['cat', ]], ['in', 1], ['bag', 1]], 经 过 排序 后 为 [['a'， 
2], [bag', 1], ['cat', 1], [in', 1]]. 





代码 3.8 ”对 向 量 内 的 元 素 进行 排序 预 处 理 





def word_frequencies_for_file(filename): 
line_list = read_file(filename) 
word_list = get_words_from line_list(line_list) 
freq_mapping = count_frequency(word_list) 
sorted_freq_mapping = sorted(freq_mapping) 
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Print ("File",filename,":",) 
print (len(line_list),"lines,",) 
print (len(word_list),"words,",) 


print (len(sorted_freq_mapping) ,"distinct words") 


return sorted_freq_mapping 





经 过 排序 后 ,就 可 以 优化 原来 内 积 的 计算 。 这 是 因为 求 内 积 的 代码 3.5 中 ,只 计 


算 了 各 自 向 量 相同 单词 的 积 。 如果 对 向 量 按照 单词 字母 排序 ,那么 就 不 需要 两 重 循 环 ， 


而 


只 需要 一 重 循环 按照 索引 就 可 以 计算 各 自 向 量 对 应 单词 的 向 量 。 优 化 后 计算 内 积 的 





实现 见 代 码 3.9。 优 化 后 因为 只 有 一 个 循环 ,其 时 间 复 杂 度 由 原来 的 O(L1L2) 提高 为 
O(L1i + L2)。 











代码 3.9 内 积 计算 优化 


def inner_product(L1,L2) : 


sum = 0.0 
i=0 
j=0 
while i<len(L1) and j<len(L2): 
if L1[i] [0] == L2[j] [0] : 
# 两 个 都 有 的 单词 才 计 算 内 积 
sum += L1[i] [1] * L2[j] [1] 
i+=1 
j+=1 
elif L1[i] [0] < L2[j] [0] : 
# 单词 L1[i] [0] 在 L1 不 在 L2 
生生 
else: 
# 单词 L2[j] [0] 在 L2 但 不 在 L1 
站 二 二 


return sum 





男 一 个 需要 优化 的 是 代码 3.4， 原来 存储 单词 与 单词 出 现 频 次 的 是 列表 , 可 以 将 它 


改 为 字典 结构 。 将 单词 与 其 出 现 频 率 看 作 一 对 数据 , 分 别 对 应 字典 的 关键 字 和 值 ( 见 代 
人 码 3.10)。Python 的 字典 数据 结构 是 哈 希 表 , 基于 哈 希 表 的 插入 与 查询 操作 时 间 复 杂 度 
均 是 O(1)。 通 过 这 个 优化 , 函数 count_frequency( ) 的 时 间 复 杂 度 将 从 原来 的 O(W?) 变 
为 O(W)。 


代码 3.10 利用 字典 数据 结构 计算 每 一 个 单词 出 现 频次 





1 def count_frequency(word_list): 


本 


3 


DB = 0 


for new_word in word_list: 


m 4 oo nn 
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if D.has_key (new_word): 
D[new_word] = D[new_word]+1 
else: 
D[new_word] = 1 
return D.items() 
3.3 ”拼写 矫正 


3.3.1 ”问题 提出 


读者 对 文档 编辑 软件 ,如 Pages、Office Word 或 者 WPS 等 一 定 不 会 陌生 ， 这 些 软 
件 一 般 都 会 有 拼写 检查 的 功能 。 当 写 好 一 份 文档 后 , 这 些 文字 编辑 软件 会 检查 文档 中 的 
每 一 个 单词 。 如 果 发 现 错 误 , 它 甚至 会 将 错误 的 单词 直接 纠正 为 正确 的 单词 。 比 如, 如果 
文档 中 有 单词 “acacss”， 软件 会 直接 将 它 改 为 “across”。 纠正 后 的 单词 往往 就 是 原来 期 
望 的 结果 , 这 些 文档 编辑 软件 是 如 何 实 现 这 一 功能 呢 ? 

如 果 软 件 的 功能 仅仅 是 标识 错误 的 单词 ， 那 这 个 功能 并 不 复杂 ,其 基本 的 流程 
就 是 : 
(1) 构造 一 个 正确 单词 的 词典 。 

(2) 分 解 文档 为 单词 集 。 

(3) 查询 文档 中 出 现 的 单词 是 否 包含 在 词典 中 。 

然而 , 如 需 对 错误 的 单词 进行 纠正 , 问题 的 难度 就 增加 了 。 这 是 因为 软件 不 仅 要 指 
出 错误 的 单词 , 还 要 给 出 纠正 后 正确 的 单词 , 就 好 比 软 件 是 站 在 学 生 身 后 的 语文 老师 ， 
随时 发 现 该 学 生 可 能 的 书写 错误 , 并 给 予 纠正 。Google 公司 的 研究 主管 Peter Norvig 曾 
经 实现 了 一 个 非常 简洁 的 单词 拼写 纠正 程序 , 该 程序 利用 贝 叶 斯 原理 进行 拼写 纠正 @。 
下 面 将 介绍 Peter Norvig 是 如 何在 短 短 21 行 Python 代码 里 面 完成 一 个 单词 拼写 纠正 
算法 的 。 





3.3.2 ”算法 设计 

假设 输入 的 语言 是 英文 ,比如 输入 单词 the, 常常 发 生 的 错误 是 tha, 或 者 也 等 。 因 
此 , 可 以 设计 一 个 函数 correct( ), 该 函数 输入 的 是 给 定 的 单词 , 输出 是 这 个 程序 纠正 后 
的 单词 ， 如 correct("tha"): the，correct("asj"): ask。 当 然 , 如 果 输 入 的 是 一 个 正确 的 单 
词 , 那么 该 程序 返回 的 就 是 这 个 单词 本 身 , 如 correct("book"): book。 
单词 输入 的 错误 来 源 在 哪儿 ? 当然 有 些 是 记忆 的 差错 , 而 更 多 的 往往 则 是 由 键盘 敲 
击 的 错误 引起 , 如 少 打 了 一 个 字符 , 多 打 了 一 个 字符 等 。 也 有 可 能 是 由 于 键盘 上 键 靠 得 
近 , 而 发 生 误 击 ,， 如 键盘 上 j 和 这 两 个 键 相 邻 , 常常 会 将 j 误 击 成 k。 











@ 读者 不 了 解 贝 叶 斯 公式 并 不 影响 理解 本 节 内 容 。 
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以 上 都 是 可 能 的 错误 来 源 , 那么 拼写 纠正 程序 如 何 发 现 这 种 错误 呢 ? 可 以 将 输入 单 
词 进行 变换 ， 如 "tha" 经 过 一 次 替换 后 成 为 "the"， 如 果 替 换 后 是 一 个 合法 的 单词 ,那么 
我 们 就 直接 返回 这 个 结果 。 

也 许 会 有 读者 会 问 , "tha" 也 有 可 能 是 "them", 或 者 "haar"。 其 实 , 这 里 有 一 个 假设 
就 是 输入 单词 发 生 一 次 错误 的 可 能 性 比 发 生 两 次 错误 的 可 能 性 大 。 也 就 是 说 , 用 户 在 输 
入 单词 "tha" 时 , 最 后 一 个 字符 a 经 过 一 次 替换 ， 就 可 以 变 为 合法 的 单词 "the" 。 而 变 为 
合法 单词 "them"， 需 要 将 "tha" 中 的 a 替换 为 e, 再 添加 一 个 字符 m, 也 就 是 经 过 了 两 
次 变换 。 因 此 , "tha" 更 可 能 是 输入 "the" 误 击 造 成 的 。 其 实 , 这 个 原理 就 是 著名 的 “ 奥 克 
姆 剃刀 ”,， 意 即 对 于 同一 现象 有 两 种 不 同 的 假说 , 我 们 应 该 采取 相对 简单 的 那个 假说 。 

"tha" 经 过 一 次 变化 可 以 得 到 "the", 也 可 以 得 到 "that"。 前 者 是 经 由 一 次 替换 ,后 者 
是 一 次 添加 。 由 于 "the" 和 "that" 都 是 合法 的 单词 , 那么 程序 该 返回 哪 一 个 呢 ? 直观 的 感 
觉 应 该 是 返回 "the", 因为 "the" 比 "that" 这 个 单词 更 常见 。 因此, 在 决定 返回 这 两 个 单词 
中 的 哪 一 个 时 , 除了 需要 确定 这 两 个 单词 是 合法 单词 , 还 需要 量化 哪个 单词 更 常见 这 一 

单词 是 否 常见 可 以 通过 统计 各 类 文档 中 单词 出 现 的 次 数 进行 量化 。 为 此 ，Peter 
Norvig 通过 在 Wiktionary 和 British National Corpus 上 下 载 一 些 书籍 和 文档 用 于 计算 
单词 是 否 常见 这 一 变量 , 这 些 文档 或 书籍 存储 于 一 个 叫 big.txt 的 文件 中 。 这 里 考虑 使 
用 Python 中 的 字典 数据 结构 来 存储 , 字典 的 key 就 是 合法 的 单词 , value 是 Wiktionary 
和 British National Corpus 上 文档 中 单词 出 现 的 次 数 。 

以 上 分 析 的 过 程 其 实 就 是 贝 叶 斯 推理 ， 即 "tha" 的 输出 结果 与 "tha" 数 据 本 身 有 
关 ( 似 然 )， 也 与 输出 单词 出 现 的 频率 有 关 ( 先 验 )。 有 了 以 上 分 析 , 下 面 就 可 以 来 分 析 
Peter Norvig 这 21 行 代码 的 实现 过 程 。 

首先 , 通过 代码 3.1 实现 文件 读 入 , 这 与 3.2 节 中 文件 读 入 的 代码 类 似 。 其 次 , 通过 
Python 的 正则 表达 式 , 将 读 入 文件 分 解 成 单词 序列 , 并 将 所 有 单词 字符 转换 为 小 写 , 见 
代码 3.11。 为 此 需要 导入 正则 表达 式 的 库 ， import re, re 是 正则 表达 式 库 的 名 字 。 正则 
表达 式 是 用 于 处 理 字 符 串 的 强大 工具 , 它 一 般 用 于 表达 字符 集合 的 规则 。 比 如 ,正则 表 
达 式 [a 一 z] 十 就 是 表示 所 有 字母 构成 的 串 , 这 个 串 可 以 是 'took', 'b', 'alwaystoo' 等 , 但 如 
果 串 中 有 数字 或 者 其 他 特殊 字符 ,如 'food3' 和 'saf#' 等 就 不 属于 这 个 正则 表达 式 。 





代码 3.11 将 文件 分 解 成 单词 序列 





def words (text) : 


return re.findall(' [a-z]+', text.lower()) 





然后 ,通过 代码 3.12 统计 单词 序列 中 每 一 个 单词 出 现 的 次 数 。 代 码 第 3 行 构造 了 
一 个 变量 model, 它 是 字典 类 型 。 变 量 model 使 用 了 Python 中 的 容器 , 因此 需要 导入 
collections 库 。 代码 第 4 行 的 循环 实现 的 功能 是 ， 当 遇 到 新 的 单词 就 将 它 添加 到 model 
这 一 字典 变量 中 , 并 将 对 应 的 value 加 1。 








oh wu nb 
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代码 3.12 计算 单词 出 现 次 数 





def train(features): 
# 生成 了 一 个 默认 value=1 的 带 key 的 数据 字典 
model = collections.defaultdict (lambda: 1) 
for f in features: 
model[f] += 1 


return model 





通过 以 下 语句 实现 对 以 上 函数 调用 , 并 将 结果 存储 于 NWORDS 变量 中 。 
NWORDS = train(words(read file('big.txt'))) 


NWORDS 中 的 结果 形 如 the: 80031，they: 3939， 表示 输入 文档 'big.txt' 中 单词 
the 出 现 了 80031 次 , 而 单词 they 出 现 了 3939 次 。 因 此 , 通过 统计 发 现 , 单词 the 的 确 
比 they 更 为 常见 。 

用 户 输入 的 单词 存在 多 种 可 能 。 第 一 种 就 是 这 个 单词 在 big.txt 中 , 说 明 它 是 一 个 合 
法 的 单词 , 可 以 在 NWORDS 中 查找 是 否 存在 用 户 输入 的 单词 , 如 果 存 在 则 返回 该 单词 ， 
否则 返回 空 ， 其 实现 代码 见 3.13。 该 代码 的 第 2 行 到 第 6 行 还 可 以 写 得 更 简洁 , 需要 利 
用 列表 推导 式 技巧 , 其 等 价 的 代码 为 

return set(w for W in words if W in NWORDS) 


由 于 NWORDS 是 字典 数据 结构 , 我 们 已 经 知道 Python 的 字典 是 哈 希 表 , 它 可 以 
在 O(1) 时 间 内 完成 搜索 。 因此 , 代码 3.13 的 执行 时 间 与 单词 的 个 数 相关 ,也 就 是 时 间 
复杂 度 为 O(len(words))。 


代码 3.13 单词 是 否 存 在 


def known(words): 
wordintxt = set([]) 
for W in words: 
if Ww in NWORDS: 
wordintxt .add(w) 


return wordintxt 





用 户 输 入 的 单词 可 能 是 合法 的 , 也 可 能 是 不 合法 的 。 这 个 不 合法 , 也 就 是 错误 , 可 能 
来 源 于 输入 单词 的 一 次 变化 , 这 个 变化 包括 少 输入 了 一 个 字符 、 替 换 了 正确 输入 、 产 生 
了 一 次 错误 的 替换 或 者 多 输入 了 一 个 字符 。 为 此 , 需要 写 一 个 函数 来 产生 这 些 变 化 , 其 
实现 代码 见 3.14。 

代码 3.14 使 用 了 列表 推导 。 如 果 输 入 单词 是 the,， 那么 代码 第 3 行 的 输出 就 是 
he、th 或 者 he。 也 就 是 删除 the 中 一 个 字符 后 的 结果 。 变 量 alphabet = abcdefghi- 
jklmnopqrstxyz。 因 此 ， the 插入 一 个 字符 后 其 结果 可 能 是 : athe，bthe，cthe 等 , 共有 
26x4=104 种 可 能 的 单词 。 
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代码 3.14 输入 单词 经 一 次 变换 后 的 结果 





def edist1(word) : 

n = len(word) 
return set([word[0:i]+word[i+l: ] for i in range(n)] + 一 # 删除 
[word[0:i]+word[i+1]+word[i]+word[i+2: ] for i in range(n-1)] + 一 # 错位 
[word[0:i]+ctword[i+1: ] for i in range(n) for c in alphabet] + 一 # 变换 
[word[0:i]+c+word[i: ] for i in range(n+1) for c in alphabet]) 一 # 添加 





除了 一 次 变换 ， 输 入 单词 也 有 可 能 发 生 两 次 变换 错误 。 为 了 简化 , Peter Norvig 只 
考虑 两 种 变化 后 该 单词 存在 于 big.txt 文件 内 的 单词 。 比如 输入 单词 “the” 经 过 两 次 变 
化 ， 且 存在 于 big.txt 的 单词 有 they, ale, roe, ethel, shoe 等 167 个 单词 。 

有 了 以 上 功能 函数 ， 就 可 以 用 于 完成 单词 纠正 函数 correct， 见 代码 3.15。 变 量 
candidates 是 输入 单词 的 四 种 可 能 情况 , 即 : 

(1) 单词 word 存在 于 big.txt 中 。 

(2) 经 一 次 变换 后 存在 于 big.txt 中 。 

(3) 经 过 两 次 变换 后 存在 于 big.txt 中 。 

(4) 原单 词 本 身 。 


代码 3.15 单词 纠正 主 程序 


def correct(word): 
candidates = known( [word]) or known(edist1(word)) or known edist2(word) or 一 [word] 
return max(candidates, key=lambda w:NWORDS[w]) 


最 后 , 通过 代码 3.15 的 第 2 行 选择 最 终 返回 的 单词 ,返回 的 是 这 些 可 能 备 选 单词 
中 其 在 big.txt 文件 中 出 现 频率 最 高 的 单词 。 如 输入 单词 为 tha, 那么 备 选 单词 有 [thy, 
that, tra, tea, th, the, ha, than, ta], 最 后 返回 的 是 这 些 备 选 单词 中 在 big.txt 中 出 现 频 
率 最 高 的 the。 


3.4 稳定 匹配 问题 


3.4.1 ”问题 提出 


市 场 上 有 一 类 公司 ， 专 门 帮助 高 端 人 才 寻 找 合适 的 岗位 ， 同 时 也 为 各 类 公司 物色 员 
工 ， 这 类 公司 往往 被 称 为 猎头 公司 。 假 如 某 信息 技术 类 猎头 公司 有 7 个 公司 的 职位 , 同 
时 也 搜罗 了 m 个 人 才 。 那么 猫 头 公司 该 如 何 将 这 mm 个 人 才 与 这 个 公司 进行 匹配 ? 如 
果 不 知道 这 些 人 才 对 目标 公司 的 偏好 , 或 公司 对 人 才 的 需求 , 那么 猎头 公 司 很 难 做 好 牵 
线 搭 桥 的 工作 。 我 们 先 考 虑 申请 人 (人 才 ) 与 公司 的 个 数 相 同 , 且 每 一 个 公司 只 收录 一 个 
申请 人 。 公 司 会 对 所 有 的 申请 人 有 一 个 偏好 打分 , 每 一 申请 人 也 会 对 所 有 公司 有 一 个 偏 
好 打分 。 
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我 们 的 目标 是 为 猎头 公司 设计 一 个 系统 , 合理 地 将 申请 人 推荐 给 公司 。 最 为 合理 的 
搭配 就 是 每 一 个 申请 人 都 进 了 各 自 最 理想 的 公司 , 同时 各 个 公司 得 到 了 自己 最 想 要 的 员 
工 。 如 果 搭 配 不 合理 ， 则 会 增加 申请 人 跳槽 的 可 能 性 。 足球 市 场 上 球员 与 球 队 间 的 转 会 
与 以 上 推荐 系统 也 有 类 似 之 处 。 如 果 球 员 转 会 到 自己 理想 的 球 队 , 而 球 队 得 到 了 想 要 的 
球员 , 那么 这 个 球 队 的 人 员 结 构 就 比较 稳定 。 

此 外 ,以 上 问题 也 可 以 类 比 于 男生 与 女生 的 婚配 。 假定 有 n 个 男生 集合 M={ma， 
m2;… ;mn}， 以 及 nn 个 女生 集合 W={wi,2w2,… ,wn}。 Mx W 表示 男生 和 女生 的 配对 
关系 矩阵 , 一 个 配对 就 是 元 素 对 m 二 ww 其 中 me M, we W, w 和 m 只 能 出 现在 一 
次 配对 中 。 图 3.1(a) 中 ,mz 一 wi, 同时 ma 一 wo ，m2 出 现在 不 同 的 配对 中 , 因此 是 
一 个 不 合法 的 匹配 。 图 3.1(b) 则 是 一 个 合法 配对 , 图 3.1(c) 为 完全 匹配 , 即 每 一 元 素 均 
出 现在 配对 中 。 





OL OL QS 
SB OL OO 
SO TO © 


(a) (b) 


图 3.1 匹配 与 完全 匹配 


我 们 还 假设 男生 m 会 对 每 一 个 女生 按照 其 喜好 进行 排序 ,如 果 有 两 位 女生 ww 和 
w'，m 更 喜欢 w， 可 以 用 w >m w 来 表示 这 种 关系 。m >w mm/ 则 表示 女生 ww 相 比较 于 
男生 mw/' 更 喜欢 男生 m。 假 如 n= 2, 喜欢 关系 为 mi : wi > was m2 : wa > 1，Wl1 : 
mi > m2, w2 : m2 > mi。 那么 图 3.2 中 两 种 不 同 的 完全 匹配 ， 哪 种 是 更 稳定 的 匹配 呢 ? 

直观 上 应 该 是 图 3.2(a) 的 匹配 更 稳定 , 因为 每 个 人 找到 的 都 是 自己 心目 中 最 佳 的 对 
象 。 而 图 3.2(b) 不 稳定 ， 比 如 某 天 当 mi 过 到 wi1， 由 于 他 们 彼此 是 对 方 理想 中 的 对 象 ， 
可 现实 中 他 们 并 不 在 一 起 。 因此, 这 种 配对 的 不 合理 体现 在 结构 的 不 稳定 ， 类 似 于 企业 
中 出 现 的 员工 跳槽 或 者 足球 队 的 运动 员 转 会 。 

不 稳定 配对 是 指 两 者 相互 亲 睐 , 但 现在 却 没有 配对 在 一 起 , 如 图 3.3 中 所 示 的 虚线 。 
直观 而 言 ,如 果 存 在 这 种 配对 关系 , 就 增加 了 ra 和 wi 发 生 “私奔 ”的 可 能 。 如 果 某 个 
配对 中 不 存在 以 上 不 稳定 配对 ， 则 说 这 个 配对 是 稳定 的 。 


(Cw) le) 
(a) (b) 
图 3.2 完全 匹配 的 比较 图 3.3 不 稳定 配对 
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现在 问题 就 可 以 表述 为 , 给 定 M 和 W 以 及 其 中 元 素 各 自 的 偏好 , 是否 存 在 一 个 完 
全 稳定 的 配对 ? 如 果 存 在 , 该 如 何 找到 它 ? 


3.4.2 ”算法 设计 

1962 年 , 美国 数学 家 David Gale 和 Lloyd Shapley 对 以 上 问题 进行 了 研究 , 并 提出 
了 一 种 寻找 稳定 匹配 的 策略 。 不管 男女 生 各 有 多 少 人 , 不 管 他 们 各 自 的 偏好 如 何 , 应 用 
这 种 策略 总 能 得 到 一 个 稳定 的 搭配 关系 。 换 句 话 说, 他 们 证 明了 稳定 的 搭配 总 是 存在 的 。 
算法 中 采用 了 男生 主动 追求 女生 的 形式 。 他 们 的 算法 描述 为 : 

(1) 第 一 轮 , 每 个 男生 都 选择 自己 名 单 上 排 在 首位 的 女生 ,并 向 她 表白 。 这 种 时 候 会 
出 现 两 种 情况 : 

(a) 该 女生 还 没有 被 男生 追求 过 , 则 该 女生 接受 该 男生 的 请 求 ; 

(b) 若 该 女生 已 经 接受 过 其 他 男生 的 追求 , 那么 该 女生 会 将 该 男生 与 她 的 现任 男友 
进行 比较 : 若 更 喜欢 她 的 男友 , 那么 拒绝 这 个 人 的 追求 ; 否则 , 抛弃 其 男友 。 第 一 轮 结束 
后 , 有 些 男 生 已 经 有 女 朋 友 了 ， 有些 男生 仍然 是 单身 。 

(2) 在 第 二 轮 追 女 行动 中 , 每 个 单身 男生 都 从 所 有 还 没 拒绝 过 他 的 女孩 中 选 出 自己 
最 中 意 的 那 一 个 , 并 向 她 表白 ， 而 不 管 她 现在 是 否 单身 。 这 种 时 候 还 是 会 遇 到 上 面 所 说 
的 两 种 情况 , 将 采用 与 (1) 中 同样 的 解决 方案 。 

(3) 直到 所 有 人 都 不 再 是 单身 。 

假如 有 三 个 男生 与 三 个 女生 , 他 们 各 自 喜 好 的 关系 如 图 3.4 所 示 。 在 第 一 轮 的 时 候 ， 
男生 rmi 选择 了 他 最 心仪 的 wi1， 由 于 该 女生 还 没有 男友 , 那么 她 暂时 同意 与 ma 交往 。 
男生 ms 最 心仪 的 女生 是 w1, 尽管 该 女生 有 交往 的 对 象 , 但 他 依然 追求 该 女生 。 女 生 wi 





WW 一 > mm ms Wi th > ma TI ma 好 信人 To Mm m3 









Wi 一 WW 一 t mm ms Wi 3 > mI 三 7722 Ma Wi Wy 盖 凡 Mmm 
ul 三 1 一 册 ma m1 ma 0 二 由 三 这 ma > mI ma Wi > ty ma m1 ma 
(a) (c) 

7 mm m3 也 一 如 一人 Th Mm Ma 





末 大 贴 二 网 ma m1 ma 


© © 





图 3.4 稳定 匹配 算法 示例 
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在 接受 男生 mms 的 追求 后 ,发 现 相 比较 于 她 现 交往 的 对 象 m1， 她 更 喜欢 m2。 因 此 , wi 
会 拒绝 掉 m1, 决定 与 ms 进行 交往 。 而 男生 ra 则 向 他 的 下 一 个 心仪 对 象 wo 发 起 追求 ， 
1 于 ua 目前 也 还 没有 交往 对 象 , 因此 接受 mi 的 交往 要 求 。 
按照 算法 依次 进行 下 去 , 可 以 得 到 最 后 如 图 3.5 所 示 的 配对 结果 。 这 个 配对 结果 不 

仅 是 完全 的 , 也 就 是 说 每 一 个 男生 与 女生 都 有 交往 对 象 , 而 且 是 稳定 的 。 需要 指出 的 是 ， 
稳定 配对 并 不 是 说 每 个 人 的 交往 对 象 都 是 最 理想 的 , 如 ms 和 wo, wo 不 是 mi 最 理想 的 
对 象 , 同样 ms 的 对 象 也 不 是 他 最 理想 的 。 但 这 种 配对 结果 稳定 , 没有 可 能 发 生 “ 私 奔 ” 
的 配对 , 也 就 是 说 不 存在 不 稳定 配对 。 

下 面 我 们 给 出 以 上 算法 正确 性 的 简单 证 明 过 程 : 类 > 他 人 w mmm 

(1) 随 着 轮 数 的 增加 ， 总 有 一 个 时 候 所 有 人 都 能 配 
上 对 。 因 为 男生 根据 自己 心目 中 的 排名 依次 对 女生 进 
行 表白 , 假如 有 一 个 人 没有 配 上 对 ， 那么 这 个 人 必定 
是 向 所 有 的 女生 进行 表白 了 。 但 是 女生 只 要 被 表白 过 i es 


























一 次 , 就 不 可 能 是 单身 。 也 就 是 说 此 时 所 有 的 女生 都 CC 个 
不 是 单身 的 ,这 也 意味 着 男生 没有 单身 的 ,这 与 有 一 
个 人 没有 配 上 对 是 相悖 的 。 所 以 假设 不 成 立 。 图 3.5 配对 结果 


(2) 随 着 轮 数 的 增加 ,男生 追求 的 对 象 越 来 越 糟 ， 
而 女生 的 男友 则 可 能 变 得 越 来 越 好 。 假设 男 m, 和 女 w 各 有 各 自 的 对 象 , 但 是 比 起 现在 
的 对 象 ， 男 m 更 喜欢 女 w。 所 以 , 在 此 之 前 男 m 肯定 已 经 跟 女 w 表白 过 的 , 并 且 女 ww 
拒绝 了 男 m, 也 就 是 女 w 有 了 比 男 m 更 好 的 男友 , 不 会 出 现 “ 私 奔 ” 的 情况 。 

可 以 根据 以 上 算法 得 到 代码 3.16, 其 中 利用 字典 数据 结构 存储 男生 与 女生 的 偏好 列 
表 (第 2 ~ 9 行 )。 如 果 共 有 n 对 男女 生 , 由 于 每 一 个 男生 都 有 可 能 与 所 有 的 女生 进行 
一 次 配对 ， 因 此 代码 3.16 最 坏 情 况 下 的 时 间 复 杂 度 为 O(n?)。 


代码 3.16 稳定 匹配 算法 


import copy 
guyprefers = { 
i 
ys Em 
3 : ['vi', ‘wv3', ‘wv2']} 
galprefers = { 
‘wi: Cm2', ‘mi', ‘m3'], 
wos Em ms m3" 
yw3': ['m3°, ‘nmi, m2]} 
guys = sorted(guyprefers.keys()) 
gals = sorted(galprefers.keys()) 


def matchmaker() : 
# 单身 男生 列表 
guysfree = guys[:] 
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# 字典 数据 结构 的 配对 关系 

engaged = {} 

# 男生 对 女生 的 喜好 

guyprefers2 = copy.deepcopy (guyprefers) 
# 女生 对 男生 的 喜好 


galprefers2 = copy.deepcopy (galprefers) 





while guysfree: 
guy = guysfree.pop(0) 
# 得 到 男生 guy 的 偏好 列表 
guyslist = guyprefers2[guy] 
# 该 男生 当前 最 喜欢 的 女生 
gal = guyslist.pop(0) 
# 女生 gal 是否 有 对 象 
fiance = engaged.get(gal) 
# 女生 还 未 配对 
if not fiance: 
# 将 男生 guy 和 女生 gal 配对 
engaged[gal] = guy 
Pprint(" %s and %s" % (guy, gal)) 
else: 
# 女生 对 男生 喜好 列表 
galslist = galprefers2[gal] 
if galslist.index(fiance) > galslist.index(guy): 
# 女生 更 偏好 当前 的 追求 者 
engaged[gal] = guy 
Pprint(" %s dumped %s for %s" % (gal, fiance, guy)) 
if guyprefers2[fiance]: 
# 前 男友 进入 单身 列表 
guysfree.append (fiance) 
else: 
# 女生 更 偏好 现 男友 
if guyslist: 
# 当前 追求 者 重新 寻找 下 一 个 对 象 
guysfree.append(guy) 
return engaged 





3.5 “小 结 


本 章 通过 三 个 例子 ， 向 大 家 展示 了 通过 简单 的 设计 就 可 以 解决 看 似 非常 复杂 的 问 
题 。 这 里 面 最 为 重要 的 是 将 问题 进行 转化 , 也 就 是 把 一 个 具体 的 问题 形式 化 描述 , 然后 
再 寻求 解决 问题 的 办 法 。 比 如 , 第 一 个 比较 两 个 文档 是 否 相同 的 问题 ,我 们 需要 将 输入 
文档 先 转化 成 单词 集合 ， 再 按照 单词 出 现 的 频率 进一步 转化 成 向 量 ， 这样 两 个 文档 的 相 
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似 度 就 可 以 通过 计算 向 量 的 夹 角 来 度量 。 第 二 个 单词 拼写 矫正 问题 , 我 们 假设 输入 的 单 
词 错误 是 由 于 删除 、 错 位、 变换 或 者 添加 这 几 种 操作 产生 的 , 如 果 错 误 拼写 单词 有 多 个 
备 选 正确 单词 , 我 们 就 选择 最 常见 的 那个 单词 作为 输出 。 第 三 个 将 猎头 公司 的 推荐 过 程 
或 者 球员 与 俱乐部 之 间 的 转 会 问题 转换 为 稳定 匹配 问题 。 同时 , 把 现实 生活 中 的 策略 抽 
象 成 一 个 算法 , 如 一 方 更 为 主动 的 追求 以 及 另 一 方略 带 贪心 的 选择 ,从 而 得 到 稳定 匹配 
算法 。 

此 外 , 一 个 算法 的 实现 还 是 不 断 优化 的 过 程 , 这 个 优化 不 仅 体现 在 算法 的 优化 ,也 
包括 实现 算法 的 代码 优化 。 通过 本 章 的 学 习 读者 还 应 进一步 掌握 Python 中 常用 数据 结 
构 ， 如 列表 和 字典 的 使 用 技巧 。 对 于 本 章 出 现 的 一 些 Python 高 级 语法 , 如 正则 表达 式 
等 , 读者 可 以 在 Python 官网 找到 更 为 详细 的 说 明 。 


课 后 习题 
习题 3-1 ”打印 出 10000 以 内 所 有 的 水 仙 花 数 ， 所谓 水 仙 花 数 是 指 一 个 三 位 数 ， 其 各 位 
数字 立方 和 等 于 该 数 本 身 。 例 如 : 153 是 一 个 水 仙 花 数 , 因为 153 = 13 十 53 十 33。 


习题 3-2 ”一 个 数 如 果 恰 好 等 于 它 的 因子 之 和 , 这 个 数 就 称 为 完 数 , 例如 6 = 1 十 2 十 3。 
编程 找 出 1000 以 内 的 所 有 完 数 。 


习题 3-3 ”实现 石头 、 剪刀 、 布 游戏 。 模 拟 两 方 对 战 该 游戏 , 共 进 行 100 局 , 输出 这 100 
局 对 战 结果 。 


习题 3-4 ”将 一 个 中 组 表达 式 转变 为 后 缀 表达 式 , 比如 9 十 (3 一 1)*3 十 10/2 转化 为 后 
级 表达 式 931 一 3* 十 102/ 十 (提示 : 采用 堆栈 实现 )。 


习题 3-5 ”输入 一 段 C++ 源 程序 , 实现 一 个 函数 去 除 源 程序 中 的 所 有 注释 与 空格 符 。 
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本 章 学 习 目 标 
。 掌 握 递归 的 基本 组 成 
。 掌 握 递归 算法 执行 的 过 程 
。 熟 练 掌握 常见 问题 的 北 归 求解 方法 
。 熟 练 掌握 求解 标准 递归 函数 工 (n) = aT(n/b) + 了 (n) 的 方法 


4.1 引言 


递归 是 程序 设计 中 常用 的 解决 问题 的 方法 ， 它 在 数据 结构 的 构造 和 算法 设计 中 都 有 
重要 的 应 用 。 然 而 ,实际 生活 中 人 们 很 少 使 用 递归 来 解决 问题 ， 因 此 初学 者 在 理解 递归 
时 往往 存在 困难 。 本章 首 先 通过 一 个 熟知 的 游戏 , 引出 如 何 筹集 巨 款 用 于 慈善 事业 这 一 
实际 的 问题 , 通过 分 析 该 游戏 背后 的 算法 , 展示 递归 的 组 成 结构 。 其 次 , 通过 分 析 求 解 斐 
波 那 契 数 的 过 程 ， 向 读者 介绍 递归 函数 在 计算 机 中 执行 的 过 程 ， 以 便 帮 助 读 者 从 计算 的 
角度 理解 递归 计算 的 过 程 。 最 后 , 总 结 出 利用 递归 求解 问题 的 基本 步骤 , 向 读者 展示 如 
何 利用 递归 求解 回 文 判断 、 全 排列 、 汉 诺 塔 和 生成 雪花 等 经 典 问题 ， 以 便 帮 助 读者 建立 
递归 思维 的 习惯 。 此 外 ,本章 还 将 介绍 求解 递归 函数 的 两 个 基本 方法 , 为 分 析 递 归 算法 
的 时 间 复 杂 度 建立 数学 基础 。 


4.2 ”递归 的 组 成 结构 


4.2.1 ”如 何 筹 集 巨 款 


2014 年 , 一 项 从 美国 流行 的 游戏 很 快 席卷 了 全 球 , 众多 的 社会 名 流 都 加 入 到 该 游戏 
中 。 这 个 游戏 是 “ 冰 桶 挑战 ” 赛 , 游戏 规则 非常 简单 ， 要求 参 与 者 在 网 络 上 发 布 自己 被 冰 
水 浇 遍 全 身 的 视频 , 然后 该 参与 者 便 可 以 要 求 其 他 人 来 参与 这 一 活动 。 活动 规定 , 被 邀 
请 者 要 么 在 24 小 时 内 接受 挑战 , 要 么 就 选择 向 对 抗 “ 渐 冻 症 ”@ 的 组 织 捐 100 美元 。 该 
活动 旨 在 提高 人 们 对 “ 渐 冻 症 ” 患 者 的 关注 ， 同 时 也 为 “ 渐 冻 症 ” 患 者 得 到 更 好 的 治疗 进 
行 募 款 。“ 冰 桶 挑战 ”首先 在 全 美 科技 界 大 咖 、 职 业 运动 员 以 及 知名 的 政治 人 物 中 迅速 风 
@ 也 被 称 为 “肌肉 萎缩 性 侧 索 硬化 症 ”。 
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靡 。 随 后, 包括 中 国 在 内 的 诸多 影视 、 体 育 明星 和 商界 大 鳄 纷纷 加 入 这 项 活动 。 据 统计 显 
示 , 仅 在 美国 就 有 170 万 人 参与 挑战 , 250 万 人 捐款 , 总 金额 达 1.15 亿美 元 。 

现在 假如 你 是 某 项 公益 活动 的 发 起 人 , 你 希望 能 募集 到 1 百 万 善 款 用 于 开展 “ 渐 冻 
症 ” 治 疗 与 康复 研究 。 如果 你 自己 有 这 笔 钱 , 那么 问题 很 简单 。 或 者 你 认识 一 位 超级 富 
豪 ,而 且 他 也 非常 慷慨 愿意 捐献 这 笔 钱 , 那么 问题 同样 简单 。 可 往往 事实 是 , 你 自己 没有 
这 笔 巨 款 ， 而 且 也 不 认识 这 么 一 位 慷慨 的 富翁 , 那 该 怎么 办 ? 尽管 需要 筹集 这 么 一 大 笔 
巨 款 困难 重重 ,但 为 了 公益 事业 仍然 希望 能 完成 它 , 也 许 一 个 可 行 的 办 法 是 寻求 朋友 的 
帮助 。 然 而 , 如 果 你 直接 要 求 你 的 朋友 捐款 , 也 许 依 然 难以 得 到 大 多 数 朋友 的 响应 ， 毕竟 
大 家 现在 生活 的 经 济 压力 都 不 小 。 

那么 该 怎样 筹集 这 笔 巨 款 呢 ? 我 们 认为 求助 朋友 是 可 行 的 办 法 , 但 不 是 直接 开口 向 
你 的 朋友 们 募捐 , 而 是 首先 说 服 你 的 朋友 们 支持 这 项 活动 。 你 应 该 采取 的 策略 包括 如 下 
几 个 步骤 : 第 一 , 找到 你 的 10 个 最 好 的 朋友 ; 第 二 ， 请 他 们 募捐 到 你 额度 的 十 分 之 一 ， 
也 就 是 说 如 果 你 需要 募集 100 万 , 那么 他 们 各 自 需要 募集 10 万 ; 第 三 , 他们 采用 和 你 一 
样 的 步骤 去 完成 他 们 的 任务 。 

当 你 的 朋友 听 到 你 的 这 个 安排 , 应 该 会 比较 容易 接受 这 个 任务 。 因 为 ， 你 没有 要 他 
们 直接 掏腰包 出 钱 , 而 且 还 告诉 他 们 该 如 何 去 完 成 这 项 任务 。 假 如 王 某 某 是 你 的 这 10 个 
朋友 中 的 其 中 一 位 ,那么 他 会 按照 你 同样 的 步骤 去 执行 他 的 10 万 元 的 筹 款 计划 。 第 一 ， 
他 会 找到 他 的 10 个 朋友 @, 第 二 , 王 某 某 的 这 10 个 朋友 筹 款额 度 是 1 万 元 ; 第 三 , 王 某 
某 也 同样 告诉 他 的 这 10 个 朋友 , 应 该 用 与 他 自己 相同 的 策略 去 筹 款 。 

也 许 到 这 儿 ， 读 者 会 非常 怀疑 这 个 办 法 是 否 真 的 能 筹集 到 100 万 元 。 因 为 , 大 家 似 
乎 都 是 在 说 着 一 个 故事 ， 然 后 依次 去 传递 故事 ,但 并 没有 人 真正 掏 钱 , 那么 如 何 能 完成 
目标 呢 ? 这 里 我 们 需要 做 一 个 额外 的 限定 , 即 当 筹 款 的 目标 款 数 小 于 等 于 100 元 时 , 就 
不 再 继续 往 下 传递 这 个 故事 ,而 是 需要 接受 这 个 任务 的 人 从 自己 的 口袋 拿 出 那 100 元 ， 
并 把 钱 送 给 向 他 发 出 募集 请 求 的 人 。 

我 们 可 以 把 上 述 筹集 资金 的 过 程 用 程序 的 形式 描述 出 来 ， 见 代码 4.1: 





代码 4.1 筹集 善 款 的 递归 算法 


def collect_contributions(n): 扼 为 需要 筹集 的 款 数 
if (n <= 100): 
return 100 # 需要 此 人 捐 出 100 元 
else: 
# 寻找 10 个 朋友 
friends = find friend() 
sum=0 
for(i=0; i<length(friends); i++): 
# 从 这 10 个 朋友 中 分 别 募集 n/10 元 
sum += collect_contributions (n/10) 


return sum  # 返回 从 10 个 朋友 募集 到 的 资金 








@ 假如 大 家 的 朋友 没有 交集 , 也 就 是 你 不 出 现在 这 10 个 朋友 中 。 
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我 们 将 筹 款 的 方法 , 或 者 说 策略 称 为 collect_contributions(n), 它 的 输入 n 表示 需 
要 募集 的 款 数 。 代码 4.1 的 第 6 行 的 函数 find_friend( ) 帮 我 们 找 出 自己 的 10 个 好 朋友 。 
然后 , 这 10 个 好 朋友 需要 用 同样 的 策略 , 去 筹集 款 数 的 十 分 之 一 。 为 此 , 定义 一 个 变量 
sum, 用 于 收集 这 10 位 好 友 筹集 到 的 钱 。 

以 上 只 是 让 朋友 们 按照 和 你 相同 的 步骤 去 筹 款 , 那么 这 里 存在 两 个 问题 : 

。 你 的 策略 是 什么 ? 

。 程序 中 如 何 表 达 “ 相 同 的 策略 ”? 

这 两 个 问题 对 应 的 解答 就 在 代码 4.1 的 第 10 行 。 也 就 是 说 , 采用 的 策略 就 叫 
collect_contributions。 相 同 的 策略 就 意味 着 用 相同 的 名 字 ， 即 你 的 这 10 个 朋友 他 们 都 
采用 策略 collect_contributions 去 筹 款 。 当 然 , 尽管 方法 / 策略 一 样 , 但 是 各 自 筹 款 数额 
并 不 一 样 , 朋友 需要 筹集 的 是 n/10。 此外, 代码 4.1 的 第 2 行 到 第 3 行 , 表示 的 就 是 前 
面 提 及 的 额外 限定 , 即 当 筹 款 人 额度 小 于 等 于 100 元 , 就 需要 掏 钱 , 而 非 继 续 找 朋友 。 


4.2.2 ”上 线 与 下 线 


按照 以 上 策略 , 真 的 能 很 容易 筹集 到 100 万 吗 ? 首先 , 我 们 发 现 按照 以 上 策略 , 问 
题 在 逐渐 变 得 简单 。 可 以 把 以 上 筹 款 的 过 程 用 图 4.1 进行 描述 。 图 4.1 中 的 根 结 点 代表 
任务 的 发 起 者 , 与 它 相 连接 的 叶子 结 点 代表 他 的 10 个 朋友 , 结 点 中 的 数字 代表 该 人 需要 
筹集 的 款 数 。 需 要 指出 的 是 , 为 了 简化 表示 , 图 4.1 中 没有 把 所 有 的 结 点 都 画 出 。 其 实 ， 
图 中 除了 叶子 结 点 外 , 每 一 个 结 点 均 有 10 个 下 级 结 点 与 它 相互 连接 。 不 难 观察 到 ,原始 
问题 从 上 到 下 依次 变 的 简单 , 通过 4 层 分 解 , 可 以 从 原来 的 100 万 元 降 到 100 元 的 筹 款 


n=1,000,000 


ss 


一 n= n= Le 7 一 n= n= n= 
100,000, 8 000 SS 100,000 100,000 


NN: “n= n= n= n= n= n= n= 1 一 n= 
10,000 /10,009/ 10,0090 A 10,000/ 10,000 /10,000 S10,000 X10,000 A 10,000 7 10,000 


Y 





4.1 筹 款 问题 策略 图 











其 次 ， 以 上 策略 包括 了 掏 钱 的 过 程 。 也 就 是 图 4.1 中 第 4 层 的 叶子 结 点 , 这 些 结 点 
对 应 的 筹 款额 度 为 100 元 。 所 有 的 叶子 结 点 就 对 应 着 最 终 出 钱 的 人 , 由 于 额度 不 大 , 此 
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时 掏 钱 的 人 应 该 都 能 接受 捐 出 这 个 款 数 。 那么 这 些 钱 是 如 何 汇总 到 发 起 人 的 呢 ? 当 图 4.1 
中 某 个 结 点 筹集 到 它 的 目标 款 数 后 ， 就 将 这 些 钱 上 交 给 向 他 派发 任务 的 人 ,也 就 是 将 钱 
交 给 该 结 点 对 应 的 父 结 点 对 应 的 人 。 依 此 逐 级 上 传 ， 最 终 将 所 有 的 钱 都 汇聚 到 发 起 人 
手中 。 

大 家 看 到 这 里 可 能 会 想到 这 似乎 和 传销 很 像 呀 。 传销 是 不 停 的 发 展 下 线 ， 自 己 的 收 
益 就 来 自 下 线 ， 下 线 成 员 越 多 收益 就 越 大 。 没 错 ,“ 冰 桶 挑战 ”游戏 就 是 一 种 包含 了 递归 
思想 的 “传销 ”游戏 。 当然, 传销 的 目的 是 满足 个 人 的 私利 , 而 “ 冰 桶 挑战 ” 则 是 为 了 公 
益 , 这 一 点 是 它们 根本 的 不 同 。 

从 以 上 解决 筹 款 问 题 的 过 程 可 以 总 结 出 ,递归 求解 问题 的 两 个 过 程 。 一 个 过 程 是 从 
上 而 下 逐 层 展开 并 简化 问题 ， 另 外 一 个 过 程 便 是 从 下 而 上 获得 问题 的 解 。 从 上 而 下 的 过 
程 对 应 着 找 朋 友 ,， 同 时 伴随 着 逐步 降低 问题 的 难度 。 而 自 下 而 上 的 过 程 意味 着 处 于 中 间 
某 层 的 结 点 已 经 筹 到 了 需要 他 筹集 的 款项 ， 该 结 点 还 有 另外 9 个 兄弟 结 点 , 他 们 同属 于 
上 一 层 结 点 的 10 个 朋友 。 如 果 这 10 个 结 点 都 筹集 到 他 们 各 自 需 要 筹集 的 款 数 ,那么 他 
们 上 一 层 的 朋友 结 点 需要 筹集 的 款项 也 就 能 完成 。 因 此 ， 自 下 而 上 对 应 着 问题 逐步 得 以 

代码 4.1 中 的 函数 collect_contributions( ) 就 是 一 个 非常 典型 的 递归 函数 。 它 具备 
了 递归 函数 最 基本 的 两 个 组 成 部 分 : 

。 必须 有 最 终 停止 发 展 下 线 的 边界 条 件 

。 必须 有 与 原始 问题 结构 一 致 , 但 输入 规模 小 于 原始 问题 规模 的 递归 结构 

代码 4.1 的 第 2 行 和 第 3 行 便 是 边界 条 件 , 而 代码 4.1 的 第 10 行 则 对 应 于 递归 结 
构 。 有 边界 条 件 , 可 以 让 我 们 避免 陷入 无 限 的 发 展 下 线 这 个 陷阱 中 。 而 递归 结构 可 以 让 
我 们 逐步 分 解 问题 到 边界 条 件 , 并 收集 从 边界 条 件 获 得 的 解 , 将 这 些 解 依次 向 上 传递 从 
而 求解 初始 的 问题 。 

通过 这 个 例子 我 们 展示 了 递归 具有 强大 的 解决 问题 的 能 力 。 用 于 传销 这 样 的 活动 ， 
极 具 诱惑 。 用 于 “ 冰 桶 挑战 ”这 样 的 公益 活动 , 能 极 大 地 推动 公益 事业 的 进展 。 





4.3 ”递归 算法 的 执行 


公元 前 13 世纪 意大利 数学 家 斐 波 那 契 的 名 著 《 算 盘 书 》， 描述 了 一 个 关于 兔子 繁殖 
的 问题 。 问题 是 指 有 一 对 兔子 饲养 在 围墙 中 ,如 果 它们 每 个 月 生 一 对 兔子 , 且 新 生 的 兔 
子 在 第 二 个 月 后 也 是 每 个 月 生 一 对 兔子 ,， 问 一 年 后 围墙 中 共有 多 少 对 兔子 。 斐 波 那 契 的 
分 析 如 下 : 第 一 个 月 是 最 初 的 一 对 兔子 生 下 一 对 兔子 ,围墙 内 共有 两 对 兔子 ; 第 二 个 月 
仍 是 最 初 的 一 对 兔子 生 下 一 对 兔子 , 共有 3 对 兔子 ; 到 第 三 个 月 除 最 初 的 兔子 新 生 一 对 
兔子 外 ,第 一 个 月 生 的 兔子 也 开始 生 兔 子 , 因此 共有 5 对 兔子 ; 继续 推 下 去 , 第 12 个 月 
时 最 终 共有 377 对 兔子 。 现在 的 问题 是 , 第 24 个 月 共有 几 对 兔子 ? 

假设 我 们 用 fib(i) 来 记录 当前 围墙 内 兔子 的 总 对 数 ,每 个 月 兔子 的 变化 数 构成 斐 波 
那 契 数列 ; 








oo om Jo on aw nn rn 
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fib(0) fibp(l) fibp(2) fib(3) fibp(4) fb5) fib(6) fip(7) 
0 1 , 2 3 5 8 13 

从 以 上 序列 不 难 观 察 到 ， 由 于 不 考虑 兔子 死亡 的 情况 , 因此 如 果 要 计算 当前 月 份 的 
兔子 , 不 仅 包 括 所 有 上 一 个 月 的 兔子 ,还 会 包括 上 上 个 月 成 熟 的 兔子 所 生育 的 新 兔子 。 
以 第 6 个 月 为 例 , 这 个 月 的 兔子 包括 第 5 个 月 所 有 的 兔子 数 5, 还 需要 加 上 上 个 月 , 也 
就 是 第 四 个 月 已 经 成 熟 会 生育 的 兔子 所 生育 的 3 对 新 兔子 。 因 此 , 第 6 个 月 的 兔子 数 是 
5 十 3 一 8。 
此 ,不 难得 到 第 n 个 月 兔子 的 总 数 的 一 般 数学 表达 式 : 

















fib(n) = fib(n — 1) + fib(n — 2) (4.1) 





式 (4.1) 中 fib(n) 定义 了 围栏 中 兔子 数量 的 变化 , 它 是 一 个 递归 函数 。 也 就 是 说 , 第 
n 个 月 的 兔子 数 应 该 是 一 个 关于 n 的 解析 式 , 但 fib(n) 并 没有 直接 给 出 这 个 解析 式 , 而 
是 建立 了 第 n 个 月 兔子 数 与 第 n 一 1 和 第 n 一 2 个 月 兔子 数 的 递归 关系 。 

要 计算 第 24 个 月 的 兔子 数 , 除了 需要 式 (4.1) 的 递归 函数 ,还 需要 确定 边界 条 件 。 
也 就 是 当 n = 0,1 时 , fib(0)=0, fib(1) = 1。 因 此 , 完整 的 斐 波 那 契 数列 公式 如 下 : 


n, n=0,1 
f(n) = (4.2) 
f(n 一 1) 十 f(n 一 2)， 其 他 


为 了 计算 第 24 个 月 的 兔子 数 , 根据 式 (4.1), 可 以 得 到 如 代码 4.2 所 示 的 计算 斐 波 
那 契 数 的 函数 fib_rec(n)。 


代码 4.2 斐 波 那 契 数 的 递归 算法 


def fib_rec(n): 
if n <= 1: 
f=n 
else: 
f=fib_rec(n-1)+fib_rec(n-2) 
return f 
if --name-- == '__main__': 
num = 24 
print('{0:5}==>{1:10d}' .format('fib('+str(num)+')', fib_rec(num))) 





这 个 函数 与 筹 款 的 代码 4.1 非常 相似 , 都 包括 了 边界 条 件 (第 2 行 - 第 3 行 ) 和 递 
归结 构 (第 5 行 )。 第 9 行 是 返回 函数 执行 结果 , 得 到 结果 如 下 : 

fib(24)==> 46368 

即 第 24 个 月 的 兔子 数 为 46368 对 。 尽管 以 上 代码 非常 简单 , 但 是 读者 对 于 这 个 函 
数 如 何 执行 出 结果 的 也 许 还 不 是 非常 清楚 , 因为 代码 中 似乎 并 没有 直接 给 出 如 何 计 算 
fib(24) 的 代码 。 
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4.3.1 ”跟踪 函数 的 执行 





为 了 清楚 的 理解 代码 4.2 中 函数 fib_rec(n) 的 执行 过 程 ， 下 面 将 模拟 该 函数 在 计算 
机 中 的 执行 过 程 ， 从 而 帮助 读者 进一步 理解 递归 计算 的 过 程 。 为 了 简化 分 析 , 假设 代码 
4.2 第 7 行 的 主 函数 main( ) 的 输入 参数 num=3, 这 时 主 程序 便 会 调用 函数 fib_rec(3)。 
图 4.2 表示 了 函数 开始 执行 的 示意 图 , 图 中 的 长 方形 用 来 表示 该 函数 正 被 执行 , 长 方形 
内 的 代码 表示 该 函数 需要 执行 的 语句 , 右 下 角 为 输入 的 参数 。 函数 之 间 的 调用 关系 通过 
长 方形 所 在 的 层次 表示 ,下 一 层 调用 上 一 层 。 此外， 函数 的 执行 过 程 还 通过 右 图 的 树 来 
表征 , 树 中 的 结 点 表示 函数 的 一 个 执行 , 结 点 内 为 该 函数 的 输入 参数 , 向 下 箭头 表示 调 














用 , 向 上 剪 头 表示 返回 ， 外 框 加 粗 的 结 点 表示 当前 执行 的 函数 。 
main | 
fib_rec(n) 


仁 fib_rec(n-1) + fib_rec(n-2) 
returnf n=3 





if n<=1: 
=n 
else: 





















n-2) 
returnf n=3 











图 4.2 函数 执行 示意 图 1 


首先 , main 函数 调用 fib_rec(n), 当前 函数 fb_rec 的 输入 参数 为 3。 当 fib_rec(3) 函 
数 执行 时 ,需要 首先 比较 n 与 1 的 大 小 ,， 显然 n > 1, 因此 程序 会 执行 到 else 内 的 语 
人 句 。else 内 的 语句 为 

f=fib_rec(n-1)+fib_rec(n-2) 

该 语句 表示 为 了 要 计算 出 f， 需 要 分 别 调用 另外 两 个 函数 ,fib_rec(n 一 1) 和 
fib_rec(n 一 2)。 按照 这 两 个 函数 出 现 的 顺序 , 会 先 执 行 ib_rec(n 一 1)。 由 于 此 时 n= 3， 
因此 也 就 是 先 调用 fb_rec(2)。 需 要 注意 的 是 ,此 时 另 一 个 函数 fib_rec(n 一 2) 还 未 被 调 
用 。 如 图 4.2 所 示 ， 从 树 结构 的 表示 来 看 ,也 就 是 n= 3 的 结 点 会 激活 其 箭头 所 指 的 
n= 二 2 的 结 点 。 

fib1(2) 的 程序 段 执行 后 , 它 依然 会 进入 全 fib_rec(n 一 1)+fib_rec(n 一 2)。 由 于 此 时 
n = 2,， 因 此 会 首先 调用 fib_rec(1), 也 就 是 树 上 n = 2 的 结 点 首先 激活 其 箭头 所 指 的 
n 三 1 结 点 , 如 图 4.3 所 示 。 
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main | 



























































fib_rec(3) 
fib_rec(n) 
if n<=1: 
=n 
| else: 
bd f= fib_rec(n-1) + fib_rec(n-2) 
returnf n=2 
fe | (= (Cn) 
fib_rec(3) 
filb_rec(2) | / 
fib_rec(n) 
UU if n<=1: 
f=n 
3 else: 
UU f=fib_rec(n-1) + fib_rec(n-2) 
returnf n=1 











图 4.3 函数 执行 示意 图 2 


此 时 ,fib_rec(1) 被 调用 , 与 之 前 的 执行 过 程 不 同 ,该 程序 段 满足 if 语句 的 条 件 ， 
也 就 是 会 执行 三 n, 此 时 n = 1。 如 图 4.4 所 示 ， 有 了 f 的 值 后 , 程序 返回 这 个 值 给 
fb_rec(2)。fib_rec(2) 的 两 个 函数 fib_rec(n 一 1) 和 fib_rec(n 一 2), 其 中 fib_rec(n 一 1)=1， 
下 一 步 便 会 调用 fib_rec(n 一 2)。 也 就 是 树 上 n= 2 的 结 点 激活 它 右 下 n= 0 的 结 点 。 








main | 






































fib_rec(3) ) 
fib_rec(2) | 
fib_rec(n) 
if n<=1: 
fn 
else: 
f=fib_rec(n-1) + fib_rec(n-2) 
return f n=1 (re (") 
main | 














fib_rec(3) | 人 \ 
fib_rec(n) 
if n<=1: 


f=n 
else: 
f=1 + fib_rec(n-2) 
returnf n=2 














图 4.4 函数 执行 示意 图 3 


如 图 4.5 所 示 , fib_rec(0) 被 调用 会 返回 f=0。 对 于 fb_rec(2) 这 个 程序 段 , 意味 着 
它 的 两 个 被 调用 函数 的 值 都 已 经 计算 出 , 分别 为 1 和 0。 对 应 到 树 上 , 也 就 是 当前 n= 二 2 
这 个 结 点 被 激活 , 并且 这 个 结 点 的 返回 值 为 1。 
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main 
fib_rect® | 
i b-rec ) 


fib_rec(2) ] 


fib_rec(n) 
让 Re 全 
fn 
else: 
f= fib_rec(n-1) + fib_rec(n-2) 
return f n=0 









































| 

















main | 











fib_rec(n) 
if n<=1: 





f=n 
else: 

f=1+0 
returnf 











图 4.5 ”函数 执行 示意 图 4 


当 fib_rec(2) 计算 得 到 值 后 ， 它 便 会 把 值 返回 调用 它 的 函数 ， 也 就 是 fb_rec(3)。 
fb_rec(3) 按照 其 代码 , 会 调用 另外 一 个 函数 fib_rec(n 一 2), 也 就 是 fib_rec(1)。 如 图 4.6 
所 示 , n = 3 的 根 结 点 的 右 下 结 点 n = 1 将 被 激活 。 








main | 
fib_rec(n) 
if n<=1: 
f=n 
else: 
f=1 + fib_rec(n-2) 
returnf n=3 




























main | 
fib_rec(3) | 
fib_rec(n) 
if n<=1: 
f=n 
else: 
f= fib_rec(n-1) + fib_rec(n-2) 
return f n=1 























图 4.6 函数 执行 示意 图 5 


fb_rec(1) 函数 执行 后 , 会 将 它 的 返回 值 1 返回 给 调用 它 的 函数 fb_rec(3)， 这 时 
fb_rec(3) 的 值 便 可 以 计算 出 来 , fib_rec(3) 把 返回 值 2 返回 给 主 函数 ,整个 递归 调用 过 
程 结束 , 根 结 点 得 到 返回 值 2, 也 就 是 fb_rec(3)=2, 如 图 4.7 所 示 。 
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main | 


fib_rec(n) 
if n<=1: 








f=1+1 














main 


fib_rec(3) = 2 

















图 4.7 函数 执行 示意 图 6 


通过 跟踪 递归 函数 的 执行 过 程 , 我 们 发 现 其 实 递归 函数 与 普通 函数 的 执行 过 程 并 没 
有 什么 区 别 。 当 函数 被 调用 后 , 将 顺序 执行 相应 的 代码 , 并 将 返回 值 返回 给 调用 函数 。 与 
普通 函数 调用 不 同 的 是 , 递归 函数 往往 其 调用 的 深度 较 深 , 也 就 是 说 一 个 函数 为 了 要 得 
到 它 最 终 的 返回 值 , 可 能 需要 调用 非常 多 的 其 他 函数 。 我 们 发 现 , 尽管 输入 参数 num=3， 
该 递归 函数 的 执行 过 程 依然 非常 复杂 , 主要 是 递归 函数 之 间 的 调用 关系 复杂 。 但 是 , 可 
以 通过 树 状 图 画 出 函数 执行 过 程 ， 由 此 得 到 函数 递归 调用 的 结构 。 

从 以 上 函数 执行 示意 图 的 树 状 图 可 以 看 出 , 递归 函数 执行 过 程 相当 于 在 树 上 遍历 每 
一 个 结 点 。 遍历 的 过 程 其 实 就 是 “深度 优先 ”( 见 第 7.5 节 ), 也 就 是 说 对 每 一 个 可 能 的 
分 支 路 径 总 是 深入 到 不 能 再 深入 为 止 , 而 且 每 个 结 点 只 能 访问 一 次 。 比 如 ， 以 上 树 状 图 
就 是 先 走 根 结 点 (n = 3)， 然 而 走 到 结 点 = 2, 再 到 结 点 n= 1。 此 时 , 结 点 n=1 这 
个 结 点 不 能 再 展开 , 意味 着 这 个 结 点 对 应 的 函数 得 到 返回 值 , 可 将 值 传递 给 它 的 父 结 点 
n 二 2。 按照 深度 优先 原则 , 结 点 n = 2 会 再 次 调用 它 的 另 一 个 子 结 点 n= 0。 结 点 n= 0 
没有 子 结 点 , 那么 就 会 计算 出 它 的 返回 值 , 并 将 该 值 返回 给 其 父 结 点 n = 2。 依 此 过 程 ， 
最 终 按照 深度 优先 原则 , 遍历 树 中 每 一 个 结 点 。 

我 们 也 可 以 用 4.2.1 节 类 似 的 分 析 方 法 来 理解 求 斐 波 那 契 数 的 过 程 。 为 了 计算 
fib_rec(3)， 我 们 知道 它 等 于 fb_rec(2)+fib_rec(1)。 由 于 fb_rec(2) 和 fib_rec(1) 比 原 
问题 fb_rec(3) 要 简单 ， 因 此 需要 充分 相信 我 们 的 两 个 “朋友 ”能 解决 fb_rec(2) 和 
fib_rec(1)。 这 两 个 “朋友 ”如 何 解 决 fb_rec(2) 和 fib_rec(1) 呢 ? 他 们 会 用 与 解 fb_rec(3) 
一 样 的 策略 进行 求解 。 也 就 是 说 他 们 仍然 采用 的 是 先 把 他 们 各 自 的 问题 简化 (往往 意味 
着 输入 参数 的 规模 变 小 ), 然后 再 去 找 他 们 的 朋友 解决 简化 后 的 问题 这 一 策略 。 这 个 依次 
降解 问题 的 过 程 不 会 无 休止 进行 下 去 , 而 是 会 在 问题 简化 到 边界 条 件 时 停止 。 

有 了 上 面 的 分 析 , 不 难得 到 求解 斐 波 那 契 数 算法 的 时 间 复 杂 度 T(m): 





T(n)= T(r —l)+T(n— 2) (4.3) 
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因为 ， 


T(n) =T(n—1)+T(n—2)+0() >fib(n) >2T(n—2)+0() >2" (4.4) 





因此 , 递归 算法 求解 斐 波 那 契 数 的 时 间 复 杂 度 是 指数 规模 增长 。 我 们 将 在 第 9.2 节 
会 再 次 遇 到 辈 波 那 契 数 ， 并 会 介绍 复杂 度 为 O(n) 的 算法 来 求解 斐 波 那 契 数 。 


4.4 利用 递归 算法 求解 问题 


通过 上 节 的 介绍 , 我 们 知道 了 递归 函数 的 执行 过 程 。 那 我 们 该 如 何 利用 递归 , 来 求 
解 具 体 的 问题 呢 ? 一 般 来 说 , 它 包 括 以 下 几 个 步骤 : 
。 不 妨 设 问题 有 解 ， 且 求解 该 问题 的 函数 为 Fnc(P),， 其 中 尸 为 函数 Fnec 的 输入 
。 将 原 问题 PP 分 解 成 大 个 子 问题 , 即 Pi, 忆 ,… ,及 
一 由 于 求解 原 问题 的 函数 为 Fnc, 因此 求解 各 子 问 题 的 函数 依然 是 Fnc 
一 子 问题 对 应 的 输入 元 素 个 数 要 小 于 原 问题 的 输入 元 素数 
。 建立 子 问 题 的 解 与 原 问 题解 的 关系 Fnc(P)=Fnc(Pi)@® Fnc( 己 ) 田 Fnc( 及 ) 
=- 根据 解 的 关系 得 到 递归 结构 ,其 中 @ 表示 函数 间 的 关系 
一 子 问题 的 最 简 形式 存在 解 
以 上 就 是 利用 递归 求解 问题 的 基本 步骤 。 下 面 将 按照 以 上 步骤 ,介绍 如 何 利用 递归 
求解 计算 问题 , 这些 问 题 包括 简单 的 回 文 判断 , 也 有 较为 复杂 的 汉 诺 塔 问题 等 。 


4.4.1 ” 回 文 判断 


回 文 是 一 个 正 向 和 反 向 读 是 相同 的 字符 串 ， 比 如 英文 单词 : level, noon; 中 文 的 句 
子 : 蜜蜂 酿 蜂 蜜 , 静 泉 山上 山泉 静 ， 上海 自 来 水 来 自 海上 。 这些 单 词 或 者 句子 正念 反 念 相 
同 。 当 给 定 一 个 字符 串 str, 需要 判断 该 字符 串 是 否 为 回 文 。 如 果 是 回 文 返回 True, 否则 
返回 False。 
判断 输入 串 是 否 为 回 文 的 简单 实现 就 是 ， 依 次 比较 输入 串 的 第 一 位 与 最 后 一 位 字 
符 。 也 就 是 : 
(1) 设 i 指 向 输入 串 s 的 第 一 位 , 7 指向 输入 串 的 最 后 一 位 ; 
(2) 重复 执行 以 下 各 步 , 直到 i > j; 
。 如 果 s[] 不 等 于 s[ 四 , 返回 False 
。i 递增 1 次 , j 递减 1 次 
(3) 返回 True。 
以 上 实现 需要 循环 n/2 次 , 其 时 间 复 杂 度 为 O(n)。 下 面 我 们 考虑 通过 递归 来 求解 以 
上 问题 , 根据 递归 求解 问题 的 步骤 。 首 先 , 不 妨 设 已 经 有 一 个 函数 js_palindrome(s) 可 以 
用 来 求解 该 问题 , 其 中 s 为 输入 。 也许 , 读者 此 时 会 有 一 些 疑问 , 函数 is_palindrome( ) 
目前 还 没有 一 句 代 码 , 怎么 就 能 用 于 求解 回 文 问题 。 其 实 , 正 是 由 于 有 这 个 假设 , 才 可 以 
逐步 去 完成 函数 的 设计 , 这 一 点 与 数学 归纳 法 的 证 明 过 程 有 异曲同工 之 处 。 
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如 果 输 入 串 s='"level'， 显 然 is_palindrome("level') 的 返回 值 应 该 为 True。 然后, 需 
要 将 该 问题 分 解 成 若干 个 子 问题 。 如 何 将 原 问 题 进 行 分 解 并 没有 固定 的 模式 ， 一 般 
的 原则 是 取 原 输入 的 子 集 。 这 里 通过 观察 不 难 发 现 ,如果 将 原 输入 的 头 尾 两 个 字符 
去 掉 ， 剩 下 的 字符 串 'eve' 显然 是 原 问题 的 一 个 子 问 题 , 求解 该 子 问题 的 函数 依然 是 
is_palindrome( )， 此 时 的 输入 为 'eve'。is_palindrome('level) 与 is_palindrome('eve') 解 
如 果 要 建立 等 价 关系 , 只 需要 判断 头 尾 字符 串 是 否 相 等 。 也 就 是 is_palindrome('level') = 
is_palindrome('eve') and ("1'=="1')。 

子 问题 规模 显然 比 原 问题 要 小 ,意味 着 可 以 逐渐 简化 原 问题 。 此 外 , 子 问题 依次 简 
化 到 最 简 形 式 就 是 只 有 一 个 输入 字符 或 者 为 空 , 此 时 的 解 应 该 返回 True。 据 此 , 不 难得 
到 如 代码 4.3 所 示 的 回 文 判断 的 递归 算法 。 





代码 4.3 回 文 算法 


def is_palindrome(s) : 
if len(s) <= 1: 
return True 
else: 
return s[0] == s[-1] and is_palindrome(s[1:-1]) 


代码 4.3 第 5 行 的 s[0] == s[ 一 1] 为 判断 s 头 尾 字符 是 否 相 等 , 如 果 相 等 返回 True， 
不 相等 则 返回 False。s[1: 一 1] 则 是 取得 s 去 掉头 尾 字符 后 的 子 串 。 需 要 指出 的 是 , 代 
码 4.3 还 有 许多 可 以 优化 的 地 方 。 比 如 , 可 以 考虑 避免 在 每 一 个 递归 中 , 频繁 调用 计算 字 
符 串 s 长 度 的 函数 len( ), 读者 可 以 自己 尝试 优化 代码 4.3。 
代码 4.3 中 包括 一 个 递归 函数 ， 除 该 递归 函数 外 其 他 语句 的 执行 时 间 均 为 常数 。 假 
设 代码 4.3 的 时 间 复 杂 度 为 T(n), 那么 T(n) 的 计算 如 下 式 所 示 : 
1 


T(n) =T(n—2)+c=T(n— 4d)+2c=.…: TD) +73 c=O(n) (4.5) 


因此 , 采用 递归 实现 回 文 判断 的 时 间 复杂 度 依然 是 O(n)。 
如 果 输 入 为 中 文字 符 串 , 就 需要 在 代码 中 加 入 编码 为 utf-8 的 设 定 , 见 代 码 4.4 的 第 
1 行 。 此外, 代码 4.4 的 第 8 行 还 需要 通过 关键 字 u 来 标示 中 文 串 的 编码 形式 。 




















代码 4.4 ”判断 中 文字 符 串 的 回 文 算法 





#coding=utf-8 
def is_palindrome(s): 
if len(s) <= 1: 
return True 
else: 
return s[0] == s[-1] and is_palindrome(s[1:-1]) 
I 
s = u" 上 海 自来水 来 自 海上 " 


if(is_palindrome(s)): 
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11 


12 


1 
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print("\""+st"\ "+" 是 回 文 1") 
else: 
print("\""+st"\" "+" 不 是 回 文 1") 





4.4.2 ”全 排列 


排列 的 定义 可 以 追溯 到 大 约 1150 年 前 的 古 印度 时 期 , 排列 在 现代 组 合 数 学 中 依然 
有 着 重要 的 应 用 。 排 列 就 是 将 不 同 物体 或 符号 根据 确定 的 顺序 重 排 , 每 个 顺序 都 称 作 一 
个 排列 。 输入 的 字符 s="ABC"， 由 字符 A, B 和 C 组 成 的 全 排列 为 ["ABC", "ACB",， 
“BAC", "BCA", "CAB", "CBA"], 

下 面 考虑 该 如 何 利用 递归 算法 , 来 求解 给 定 输入 字符 的 全 排列 。 按照 递 归 算法 的 步骤 ， 
不 妨 设 求解 原 问题 的 函数 为 permutation(s)， 其 中 s 为 输入 的 字符 串 。 然 后 ， 分 解 原 问 题 
为 若干 个 子 问题 。 通 过 观察 排列 的 结果 , 不 难 发 现 字符 A, B 和 C 组 成 的 全 排列 等 于 

。 字符 'A'+permutation('BC') 

。 字符 'B'+permutation('AC') 

。 字符 'C!++permutation('AB') 

也 就 是 说 , 要 产生 n 个 字符 的 全 排列 , 需要 每 次 选 出 这 n 个 字符 中 的 一 个 , 将 这 个 
字符 与 剩 下 的 其 他 n 一 1 个 字符 产生 的 排列 结果 进行 连接 。 产生 一 1 个 字符 的 全 排列 
显然 是 原始 问题 的 子 问 题 , 而且 产生 一 1 个 字符 的 全 排列 与 产生 nn 个 字符 的 全 排列 问 
题 可 以 使 用 相同 的 函数 。 子 问题 输入 元 素 个 数 比 原 问 题 的 输入 元 素 个 数 要 小 , 这 意味 着 
子 问题 比 原 问 题 规模 小 。 依 此 逐渐 减 小 问题 规模 , 子 问 题 的 最 简 形 式 就 是 当 输 入 元 素 个 
数 小 于 等 于 1,， 此 时 的 解 就 是 该 元 素 本 身 。 因 此 , 子 问题 的 最 简 形 式 有 解 。 

根据 以 上 分 析 , 我 们 就 可 以 得 到 如 代码 4.5 所 示 的 求全 排列 的 递归 算法 。 





代码 4.5 产生 全 排列 的 递归 算法 


def permutation(str): 
lenstr = len(str) 
if lenstr < 2: # 边界 条 件 
return str 
else: 
result = [] 
for i in range(lenstr): 
ch = str[i] # 取出 str 中 每 一 个 字符 
rest = str[0:i] + str[i+1:lenstr] 
for s in permutation(rest): # 递归 
result.append(ch + s) # 将 ch 与 子 问题 的 解 依次 组 合 


return result 


if --name-- == '__main _': 


print (permutation('ABC')) 
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代码 4.5 第 7 行 索引 每 一 个 输入 字符 , 再 将 它 存 入 到 变量 ch 中 。 然后, 将 去 除 该 字 
符 后 剩余 的 串 存 储 于 变量 rest 中 。 代码 4.5 第 10 行 调 用 递归 函数 permutation( ), 产生 
rest 的 全 排列 。 由 于 rest 的 全 排列 可 能 有 多 个 解 , 因此 需要 使 用 第 10 行 的 循环 , 由 变量 
s 索引 其 中 的 每 一 个 元 素 。 第 11 行将 字符 str 的 第 i 个 字符 'ch' 分 别 与 permutation(rest) 
中 的 各 个 串 进 行 连接 , 并 将 连接 后 的 结果 存储 于 列表 类 型 的 变量 result 中 。 

对 于 长 度 为 的 输入 字符 串 , 共有 nl 个 全 排列 ,因此 代码 4.5 的 时 间 复 杂 度 为 
O(nl), 这 是 一 个 指数 规模 增长 的 时 间 复 杂 度 。 



























































4.4.3 ” 汉 诺 塔 问题 

下 面 介绍 递归 算法 用 于 一 个 非常 经 典 的 汉 诺 塔 (Tower of Hanoi) 游戏 问题 , 它 是 源 
于 印度 一 个 古老 传说 的 益 智 玩具 。 法 国 数学 家 爱德华 。 卢 卡 斯 对 这 个 传说 有 一 段 非常 形 
象 的 描述 : 

在 世界 中 心 贝 拿 勒 斯 (在 印度 北部 ) 的 圣 庙 里 , 一块 黄 铜板 上 插 着 三 根 宝石 针 。 印度 
教 的 主神 楚 天 在 创造 世界 的 时 候 ， 在 其 中 一 根 针 上 从 下 到 上 地 穿 好 了 由 大 到 小 的 64 片 
金 片 , 这 就 是 所 谓 的 汉 诺 塔 。 不论 白天 黑夜 ,总 有 一 个 僧侣 在 按照 下 面 的 法 则 移动 这 些 
金 片 : 一 次 只 移动 一 片 ,不 管 在 哪 根 针 上 ,小片 必 须 在 大 片上 面 . 僧侣 们 预言 ， 当 所 有 的 
金 片 都 从 楚 天 穿 好 的 屠 根 针 上 移 到 另外 一 根 针 上 时 ,世界 就 将 在 一 声 替 雳 中 消灭 ,而 楚 
塔 、 庙宇 和 众生 也 都 将 同归于尽 。 


A B C 


图 4.8 汉 诺 塔 问题 的 初始 状态 


为 了 简化 问题 的 描述 , 不 妨 设 共 有 8 个 大 小 不 一 的 圆 盘 , 它们 初始 的 位 置 如 图 4.8 
所 示 , 我 们 需要 把 圆 盘 从 A 柱 移 到 B 柱 , 移动 过 程 必 须 符合 以 下 规则 : 

。 每 次 只 能 移动 一 个 盘子 

。 移动 过 程 中 , 小 的 盘子 不 能 处 于 比 它 大 的 盘子 下 面 

按照 递归 算法 求解 问题 的 步骤 。 第 一 步 , 假设 有 函数 hanoi(n, S='A', T='B', H='C') 
可 以 求解 该 问题 , 其 中 m 为 盘 片 数 ，A, B 和 C 分 别 为 三 个 柱子 , S 表示 出 发 的 柱子 , 了 
为 目的 柱 , HH 为 过 渡 用 柱子 。 函 数 hanoi(n, S='A', T='B', H='C') 执行 的 结果 就 是 , 所 
有 在 A 柱 上 的 盘 片 按照 限定 的 规则 移 到 了 B 柱 。 

第 二 步 , 需要 考虑 将 原 问题 进行 分 解 。 可 以 考察 盘 片 中 最 长 的 盘 片 ， 如果 将 所 有 盘 
片 从 A 柱 移 到 B 柱 , 那么 这 个 最 长 的 盘 片 必须 在 其 他 所 有 盘 片 之 前 进入 B 柱 。 在 该 盘 
片 进 入 B 柱 后 , 其 他 盘 片 才能 依次 进入 B 柱 。 该 最 长 盘 片 要 进入 B 柱 , 就 需 将 它 之 上 
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的 所 有 盘 片 移 开 到 C 柱 , 也 就 是 如 图 4.9 所 示 的 状态 。 将 A 柱 上 除 最 长 盘 片 移 到 C 柱 ， 
这 其 实 与 原 问 题 的 结构 是 一 致 的 子 问题 。 这 两 个 问题 不 一 样 的 地 方 就 是 , 原 问 题 的 盘 片 
数 是 8, 现 问 题 的 盘 片 数 则 为 7。 另 一 个 不 一 样 就 是 , 原 问 题 是 将 盘 片 从 A 柱 移 到 B 柱 ， 
而 子 问题 则 是 将 盘 片 从 A 柱 移 到 C 柱 。 因此, 求解 子 问 题 的 函数 为 hanoi(n 一 1, S='A'， 
T='0', H='B')。 





A B C 
图 4.9 汉 诺 塔 问题 中 间 状 态 1 


当 把 A 柱 上 除 最 长 的 盘 片 之 外 的 盘 片 都 移 开 后 , 就 可 以 将 该 最 长 的 盘 片 从 A 柱 移 
到 也 柱 。 这 一 步 非常 简单 , 只 需要 进行 一 次 移动 , 因此 可 以 使 用 函数 moveSingle(S='A'， 
T='B') 来 实现 。 该 函数 的 功能 就 是 , 将 柱 A 中 的 一 个 盘 片 ， 移 动 到 柱 B, 得 到 如 图 4.10 
所 示 的 结果 。 


A B G 
图 4.10 汉 诺 塔 问题 中 间 状 态 2 


紧 接 着 , 只 需要 将 在 C 柱 的 7 个 盘 片 移 到 B 柱 就 可 以 实现 目标 , 如 图 4.11 所 示 。 当 
前 状态 与 汉 诺 塔 问题 的 初始 状态 , 也 具有 同样 相同 的 结构 。 这 两 个 状态 也 有 两 点 不 一 样 。 
第 一 ， 当 前 状态 的 出 发 柱 有 7 个 盘 片 , 而 初始 状态 的 出 发 柱 有 8 个 盘 片 。 第 二 ， 当 前 状 
态 的 出 发 柱 为 C 柱 , 而 初始 状态 的 出 发 柱 为 A 柱 。 由 于 假设 函数 hanoi( ) 可 以 求解 原 问 
题 , 那么 由 于 当前 状态 的 问题 结构 与 初始 问题 结构 一 致 , 因此 同样 可 以 通过 函数 hanoi( ) 
来 求解 当前 状态 的 问题 。 此 时 , 函数 的 输入 为 hanoi(n 一 1, S='C', T='B', H='A')。 不 难 
发 现 , 函数 参数 的 变化 体现 了 之 前 提 及 的 两 点 不 一 致 。 





A B C 
图 4.11 汉 诺 塔 问题 结束 状态 
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代码 4.6 汉 诺 塔 算法 





def hanoi(n, source, target, helper): 
if n==1: # 边界 条 件 
moveSingleDesk(source, target) 
else: 
hanoi(n - 1，source，helper，target)  # 将 n-1 个 盘 从 A 移 到 C 
moveSingleDesk(source，target) # 将 A 中 最 大 的 一 个 盘 移 到 B 
hanoi(n - 1，helper，target,source) # 将 n-1 个 盘 从 C 移 到 B 
def moveSingleDesk(source，target) : 
disk = source[0] .pop() 
Print("moving " + str(disk) + " from " + source[1] + " to " + target[1]) 
target [0] .append(disk) 


if --name-- == '--main_ _': 
A= ([4,3,2,1], "A") 
B= Ll, “BY 
= (0 "Ee") 


hanoi(len(A[0]),A,B,cC) 


根据 以 上 分 析 , 可 以 得 到 如 代码 4.6 所 示 的 求解 汉 诺 塔 问题 的 递归 算法 。 在 算法 中 ， 
采用 三 个 集合 用 来 表示 柱子 , 每 一 个 集合 包括 存储 该 柱子 盘 片 的 序列 ， 以 及 该 柱子 名 字 
两 个 对 象 。 比 如 , 代码 4.6 第 13 行 表示 初始 情况 下 A 柱 有 4 个 盘 片 。 此 外 , 假设 盘 片 大 
小 与 数字 大 小 对 应 ， 即 数字 越 大 盘 片 也 越 大 。 

代码 4.6 的 第 2 行为 边界 条 件 , 当 只 有 一 个 盘 片 时 , 便 将 该 盘 片 从 出 发 柱 移 到 目的 
柱 。 通 过 函数 moveSingleDesk( ) 移动 一 个 盘 片 , 即 从 source 中 弹出 其 顶端 的 一 个 元 素 ， 
然后 将 该 元 素 加 到 target 的 顶端 。 代 码 4.6 的 第 10 行为 打印 哪个 盘 片 从 出 发 柱 移 到 目 
标 柱 。 

代码 4.6 第 5 行 实现 的 就 是 从 图 4.8 到 图 4.9 所 示 的 移动 过 程 。 第 6 行 则 是 从 图 4.9 
到 图 4.10 的 移动 过 程 , 而 第 7 行 实现 了 从 图 4.10 到 图 4.11 的 移动 过 程 。 

以 上 函数 执行 的 结果 为 : 


moving 1 from A to C 
moving 2 from A to B 
moving 1 from C to B 
moving 3 from A to C 
moving 1 from B to A 
moving 2 from B to C 
moving 1 from A to C 
moving 4 from A to B 
moving 1 from C to B 
moving 2 from C to A 
moving 1 from B to A 
moving 3 from C to B 
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moving 1 from A to C 
moving 2 from A to B 
moving 1 from C to B 


结果 的 第 一 行 表明 从 A 柱 将 盘 片 移 到 C 柱 , 后 面 各 行 依次 为 各 个 盘 片 的 移动 过 
程 。 读 者 不 妨 按照 以 上 步骤 画 出 盘 片 的 移动 , 验证 这 个 结果 是 否 违反 了 汉 诺 塔 移动 的 
规则 。 

代码 4.6 的 执行 时 间 复 杂 度 为 : 


T(n)=2T(n—1)+c=2T(n—2)+c=:…=2"T(1)+e (4.6) 














以 上 结果 由 替换 法 推导 出 了 T(n) 的 结果 , 读者 可 以 通过 数学 归纳 法 证 明 该 结果 。 其 
中 , 2T(m 一 1) 为 两 个 递归 调用 的 时 间 ， 而 常数 为 移动 一 个 盘 片 的 时 间 。 因 此 , 利用 递 
归 算 法 求解 汉 诺 塔 问题 的 时 间 复 杂 度 为 0(2”)。 











4.4.4 ”雪花 曲线 


递归 算法 除了 可 以 用 来 解决 计算 问题 , 还 可 以 用 于 艺术 创作 ,如 生成 分 形 图 。 分 
形 图 是 在 不 同 尺度 上 具有 相同 结构 的 几何 图 。 其 中 , 瑞典 人 科 赫 于 1904 年 提出 了 著名 
的 “雪花 ” 曲线， 这 是 最 早 的 分 形 图 之 一 。 


(a) (b) (0) 
图 4.12 构造 雪花 曲线 的 正三 角形 











雪花 曲线 的 构造 从 一 个 正三 角形 开始 , 如 图 4.12(a)。 把 每 条 边 分 成 三 等 份 , 然后 以 
各 边 的 中 间 长 度 为 底 边 , 分 别 向 外 作 正 三 角形 ,再 把 “ 底 边 ”线段 抹 掉 ， 这 样 就 得 到 一 个 
六 角形 , 它 共 有 12 条 边 , 如 图 4.12(b) 所 示 。 再 把 每 条 边 分 成 三 等 份 , 以 各 中 间 部 分 的 
长 度 为 底 边 , 向 外 作 正 三 角形 后 , 抹 掉 底 边 线段 。 
反复 进行 这 一 过 程 , 就 会 得 到 一 个 “雪花 ”样子 的 曲线 , 如 图 4.12(c)。 这 曲线 叫做 科 
赫 曲 线 或 雪花 曲线 。 

可 以 采用 用 以 下 递归 算法 完成 曲线 的 绘制 : 如 果 n = 0, 直接 画 出 长 度 为 工 的 直线 
即 可 (如 图 4.13 第 1 行 )。 如 果 n = 1 (第 一 次 迭代 )， 画 出 长 度 为 卫 /3 的 线段 ; 画笔 向 
左 转 60 度 再 画 长 度 为 工 /3 长 的 线段 ; 画笔 向 右 转 120? 画 长 度 为 L/3 长 的 线段 ; 画笔 再 
向 左 转 60° 画 出 长 度 为 工 /3 的 线段 (如 图 4.13 第 2 行 )。 如 果 n > 1, 第 n 次 迭代 相当 
于 : 第 n 一 1 次 迭代 ; 画笔 左 转 60°; n 一 1 次 迭代 ; 画笔 右 转 120°; 第 n 一 1 次 迭代 ; 画 
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笔 左 转 60°; 第 n 一 1 次 迭代 (如 图 4.13)。 其 中 , 第 mn 一 1 次 迭代 线段 长 度 为 L, 第 n 次 


迭代 时 线段 长 度 则 为 L/3。 


n=0 








图 4.13 雪花 曲线 构图 示例 











代码 4.7 绘制 雪花 曲线 


import turtle 
def koch(t, order, size): 
if order == 0: # 边界 条 件 


t.forward(size) 


else: 
koch(t，order-1，size/3) # 递归 调用 
t.left(60) # 笔 转 60 度 
koch(t，order-1，size/3) # 递归 调用 
t.right (120) # 笔 转 120 度 
koch(t, order-1, size/3) # 递归 调用 
t.left (60) # 笔 转 60 度 
koch(t, order-1, size/3) # 递归 调用 


根据 以 上 分 析 ， 可 以 得 到 如 代码 4.7 所 示 的 雪花 曲线 递归 实现 。 代 码 第 1 行 调用 
Python 中 一 个 简单 的 绘图 库 turtle。 代码 第 6 行 、 第 8 行 、 第 10 行 和 第 12 行 分 别 为 递 
归 调 用 。 第 7 行 、 第 9 行 和 第 11 行为 画笔 的 旋转 , 其 中 变量 t 表示 turtle 对 象 , 或 者 将 
它 看 做 画笔 。 以 上 实现 表明 在 每 一 个 尺度 的 雪花 曲线 , 都 是 在 它 前 一 个 尺度 的 基础 上 结 





合 角 度 旋转 完成 的 。 


4.5 递归 函数 的 求解 
使 用 递归 算法 求解 问题 时 ， 其 算法 运行 时 间 也 往往 


由 递归 函数 来 表示 。 考 虑 判断 回 





文 算法 , 假定 输入 字符 串 长 度 为 n。 显 然 该 函数 时 间 复 杂 度 与 输入 字符 的 长 度 有 关 , 也 
就 是 字符 串 长 度 越 长 , 其 运行 时 间 也 越 长 。 因此 , 函数 is_palindrome(s) 的 时 间 复 杂 度 必 
然 是 的 函数 。 不 妨 设 该 函数 为 了 (nm)， 如 何 得 到 该 函数 呢 ? 
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如 果 输 入 长 度 小 于 1, 那么 很 容易 知道 了 (n) = 1。 当 输入 字符 长 度 大 于 1 时 , 根据 
函数 is_palindrome(s)， 并 不 能 直接 给 出 T(n) 的 具体 函数 。 因 为 函数 is_palindrome(s) 
递归 调用 另外 一 个 函数 is_palindrome(s[1: 一 1])。 尽 管 不 能 直接 给 出 T(n) 的 表达 式 ， 
但 是 可 以 根据 函数 调用 关系 得 到 T(") 应 该 等 于 T(n 一 2) 加 上 一 个 常数 。 因 为 函数 
is_palindrome(s[1: 一 1]) 的 输入 长 度 为 于 一 2， 既 然 函 数 is_palindrome(s) 的 时 间 复 杂 度 
为 T(n), 那么 函数 is_palindrome(s[1: 一 1]) 的 时 间 复 杂 度 就 是 T(n 一 2)。 加 一 个 常数 是 
因为 函数 is_palindrome(s) 中 还 有 一 个 条 件 判断 语句 。 

根据 以 上 分 析 , 判断 回 文 的 递归 算法 其 时 间 复 杂 度 为 : 

T(n)=T(n-2)+e (4.7) 
然而 , 该 函数 并 没有 给 出 T(n) 的 具体 表达 式 ， 也 就 是 说 从 这 个 递归 函数 我 们 依然 
不 知道 了 (nm) 会 随 着 n 的 增长 究竟 如 何 变化 。 下 面 介 绍 递 归 函 数 的 两 个 主要 求解 办 法 。 


4.5.1 ”替换 法 


可 以 根据 递归 函数 , 不 停 地 对 其 进行 按照 递归 函数 进行 符 换 , 然后 根据 其 变化 的 规 
律 , 得 到 了 (n) 的 表达 式 。 比 如 : 





T(n) = T(n—2)+ec 
= (T(n—-4)+oc)+ec 
= T(n—4)+2c 
= T(n—6)+3c 





三 T()+ Fe 














n 1 
st ae (FY=W 


= O(n) 
以 上 的 推导 结果 还 需要 进行 证 明 。 而 证 明 的 方法 就 是 数学 归纳 法 。 如果 T(n) = 
T(n) & kn (4.8) 
其 中 ,为 常数 。 首先 , 确定 基准 条 件 下 不 等 式 成 立 , 即 了 (1) = 1 < ,此 时 只 需要 
取 训 > 1 即 可 。 
然后 , 不 妨 设 (2),T(3),…- ,T(n 一 2) 时 式 (4.8) 都 成 立 。 
最 后 , 根据 归纳 假设 知 T(n 一 2) < k(n 一 2), 因此 可 得 : 
T(rn) = T(n—2)+ec 
k(n—2)+c 
= kn+i+c—2k 
kn, (c— 2k < 0,k> c/2)= O(n) 


从 


人 
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也 就 是 根据 归纳 假设 , 推导 出 T(n) < kn, 即 T(n) = O(n)。 

数学 归纳 法 证 明 递 归 函 数 解 , 与 递归 算法 求解 问题 过 程 有 异曲同工 之 处 。 首 先 , 它 
们 都 是 将 原 问题 分 解 成 若干 相关 (递归) 的 子 问题 。 其 次 , 它们 都 需要 有 一 个 基准 条 件 成 
立 。 最 后 , 它们 都 是 从 具体 到 一 般 归 纳 出 解 。 数 学 归纳 法 是 先 建立 归纳 假设 , 也 就 是 输入 
规模 为 1,2,… ,n 一 1 时 递归 函数 的 解 满足 条 件 , 然后 尝试 推导 输入 规模 为 n 的 函数 能 
满足 条 件 ， 由 此 来 证 明 递 归 式 正确 。 而 递归 算法 中 , 则 假定 输入 规模 为 n 时 ,能 得 到 最 
终 的 解 , 具体 的 解 则 需要 根据 递归 算法 逐步 求解 。 

下 面 再 来 证 明 递归 式 T(n) = 2T(n/2)+n 的 解 为 T(n) = O(nlogn), 其 中 7T(1) = 0。 
不 难 验证 当 n = 1 时 , 等 式 成 立 。 不 妨 设 当 n < 天时, 均 有 T(n) < cnlogn。 下 面 将 证 明 
当 上 =n 时, 有 T(n) = O(nlogn)。 








T(n) = 27T(n/2)+n 
二 c(n/2)log(n/2) 十 n, (由 归纳 假设 ) 
= c(n/2)(logn—log2)+n 
= cnlogn+t+n— cn/2,( 取 c > 2) 
= O(nlogn) 


在 利用 数学 归纳 法 证 明 递 归 函 数 解 时 , 需要 注意 最 后 一 步 得 到 解 的 过 程 , 往往 表达 
式 都 是 变换 成 desired-residual，desired 是 需要 得 到 的 结果 , 而 residual 是 大 于 0 的 常数 
项 , 这样 我 们 才能 得 到 递归 式 等 于 O(desired)。 


4.5.2” 主 分 析 法 


以 上 数学 归纳 法 是 证 明 递归 函数 解 的 一 个 强大 工具 , 然而 如 何 得 到 解 则 需要 男 外 的 
技巧 。 这 个 技巧 就 是 猜 , 也 就 是 说 可 以 先 猜测 一 个 解 , 然后 再 用 数学 归纳 法 进行 证 明 。 这 
里 的 猜 当 然 是 根据 我 们 的 经 验 进行 猜测 ， 而 不 是 天 马 行 空 的 睹 猜 。 经验 来 自 于 之 前 见 过 
的 类 似 递归 函数 ,并 且 知 道 它 的 解 。 

尽管 合理 猜测 是 解决 问题 非常 重要 的 一 种 方法 ,但 这 需要 积累 相当 的 经 验 才 可 以 
猜 出 一 个 合理 的 解 。 为 此 , 介绍 另 一 个 求解 递归 式 常用 的 方法 ， 即 主 分 析 法 (Master 
Method)。 该 方法 往往 用 于 求解 以 下 类 型 的 递归 式 ， 


T(n)=aT(n/b) +f(n),(a>1,6>1) (4.9) 


以 上 递归 函数 最 常见 于 分 治 算法 ( 见 第 6 章 ) 的 时 间 复 杂 度 , 其 中 a 和 分 别 表示 
将 原 问 题 分 解 成 a 个 子 问题 , 及 子 问题 的 规模 为 n/b。f(n) 为 其 他 计算 的 时 间 。 为 了 更 
好 的 理解 主 分 析 法 的 计算 过 程 ， 需 要 通过 递归 树 来 帮助 我 们 理解 。 为 此 , 可 以 从 具体 的 
例子 开始 , 如 : T(n) = 27(nz/2) 十 O(m)。 

我 们 的 目的 是 根据 递归 函数 T(n) = 2T(n/2) 十 O(n), 求 出 T(n) 的 渐进 解 ， 解 的 形 
式 是 自 变量 为 n 的 函数 。 为 此 , 我 们 可 以 将 T(n) 按照 递归 式 展开 , 并 将 展开 过 程 用 树 来 
表示 , 如 图 4.14 所 示 。 树 中 结 点 内 的 数字 表示 函数 了 的 输入 参数 ,上 为 树 的 高 度 。 先 将 
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T(n)=2T(n/2)+0(n) 








SB 
惠 十 有 洁 = Ona 
J 


o[ 立 > 滞 = o 人 站 =0(kn) SO 0 


i=0 


图 4.14 T(n) =2T(n/2) 十 O(n) 递归 树 


T(n) 按照 递归 函数 进行 展开 , 也 就 是 包括 三 个 部 分 T(n/2),T(n/2), O(n), 每 一 个 都 对 
应 于 树 上 的 一 个 结 点 。 那么 T(n) 就 变 成 了 这 三 个 结 点 的 和 , 根 结 点 为 O(n)， 两 个 叶子 
结 点 为 T(n/2)。 显然, 仅仅 由 这 三 个 结 点 依然 得 不 到 了 T(n) 的 具体 函数 , 那 不 妨 再 展开 
另外 两 个 叶子 结 点 了 (mn/2)， 该 结 点 的 展开 可 以 按照 了 (nm/2) = 2T(n/4) + O(n/2) 进行 。 
依次 展开 的 目的 是 使 得 树 的 每 一 层 都 是 n 的 函数 , T(n) 就 等 于 各 层 的 累加 和 。 

依次 按照 递归 函数 展开 ， 直到 叶子 结 点 不 能 被 展开 为 止 , 也 就 是 叶子 结 点 变 为 
了 T(1)。 不妨 设 经 过 了 大 次 展开 , 那么 叶子 结 点 T(n/2*) = T()， 即 大 = logm。 大 为 树 的 
高 度 , 图 4.14 的 树 上 每 一 层 的 和 为 O(n), 因此 树 上 所 有 结 点 的 和 为 nlogn, 也 就 是 说 
T(n) = O(nlogn)。 


fln) 


f(n/b) f(n/b) 


log, n 





a alogjm 一 mlogba 


图 4.15 Master method 的 递归 树 


按照 以 上 过 程 ， 同 样 利用 递归 树 来 求解 式 (4.9)。 该 式 按照 递归 函数 在 树 上 进行 展开 
的 过 程 如 图 4.15 所 示 。 图 中 根 结 点 的 和 为 f(n), 第 二 层 结 点 的 和 为 af(n/b), 第 三 层 结 
点 的 和 为 a2 了 (n/ 态 )。 树 的 高 度 为 logs n。 由 于 ， 
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logs alogp7m = log;, nlog, a 


4.10 
logs nss° = logs alogem ( ) 

此 外 , 每 一 层 结 点 数 是 上 一 层 结 点 数 的 a 倍 , 因此 树 的 叶子 结 点 个 数 为 
ar 一 alogsnm — nlogea (4.11) 





因此 , T(n) 就 等 于 各 层 结 点 和 , 即 T(n) = f(n) +af(n/b) +a2f(n/P) 十 … 十 
mss59 了 (1)。 现在 T(n) 已 经 是 关于 的 函数 , 它 的 渐 近 大 小 与 f(n) 和 nlogsa 的 相对 大 
小 有 关 。 

主 分 析 法 求解 形 如 式 (4.9) 的 解 时 , 按照 以 下 三 种 情况 分 别 得 到 解 : 

(1) 当 f(n) = O(mss。-e), e 是 大 于 0 的 常数 。 这 种 情况 意味 着 , 递归 树 上 各 层 结 点 
的 和 从 根 结 点 开始 依次 递增 ,由 于 渐进 表示 可 以 去 掉 低 次 项 , 因此 得 T(n) = 6(moge")。 

(2) 当 jn) = O(moss1log*n), 大 是 大 于 等 于 0 的 常数 。 这 种 情况 意味 着 , 递归 树 上 
各 层 结 点 的 和 从 根 结 点 开始 并 没有 显著 变化 , 因此 得 T(n) = e(nloss log*+1n)。 

(3) 当 fn) = Q(mlossete), e 是 大 于 0 的 常数 , 同时 对 于 常数 c < 1 满足 af(n/b) < 
cf(n)。 这 种 情况 意味 着 ,递归 树 上 各 层 结 点 的 和 从 根 结 点 开始 依次 递减 ， 因 此 得 
T(n) = ©(f(n)). 

比如 , 当 T(n) = 2T(n/2) ++n 时 , a=2,b=2, f(n) =n= O(nbs logtn),。 此 时 
大 = 0, 满足 第 二 种 情况 。 因此, T(n) = O(nlogn)。 

再 比如 , T(n) = 2T(n/2) 十 c 时 ， f(n) = c= 0O(mes -), 即 满 足 第 一 种 情况 。 因 
此 , T(n) = O(n)。 当 T(n) = 2T(n/2) 十 品 时 , f(n) = n? = O(nmbeBs+e), 即 满足 第 三 种 
情况 。 因 此, T(n) = O(n?)。 

也 就 是 说 , 在 求解 递归 式 时 只 需 按照 主 分 析 法 , 依次 比 对 f(n) 和 nesse 之 间 的 大 小 
关系 ,以 确定 属于 以 上 三 种 情况 的 哪 一 种 , 就 可 以 求 得 T(n) 的 渐进 解 。 





4.6 小 结 


本 章 主要 介绍 了 递归 的 组 成 以 及 通过 递归 算法 如 何 求解 计算 问题 。 递 归 包 括 了 两 个 
组 成 部 分 ,一 是 边界 结构 , 另 一 个 便 是 递归 结构 。 边 界 结构 确保 递归 程序 的 执行 会 终结 ， 
递归 结构 的 作用 是 分 解 问 题 并 收集 最 终 问题 的 解 。 在 利用 递归 求解 问题 时 ,其 主要 的 步 
又 用 通俗 的 语言 说 就 是 “ 找 朋 友 ”, 以 及 “信任 朋友 ”。 对 于 需要 求解 的 问题 , 递归 算法 总 
是 尝试 将 问题 简化 , 然后 寻求 朋友 们 来 帮助 求解 简化 后 的 问题 。 此 外 , 递归 算法 要 求 “ 信 
任 朋 友 ”, 也 就 是 一 定 要 相信 你 的 朋友 能 解决 你 给 予 他 的 问题 。 此 时 , 也 许 你 的 朋友 并 没 
有 给 出 他 求解 问题 的 具体 步骤 , 但 是 相信 他 能 得 到 问题 的 解 。 正 是 有 这 种 信任 才 可 以 让 
你 去 根据 朋友 们 的 解 与 原 问题 解 的 关系 , 构造 递归 关系 。 

求解 递归 式 可 以 先 用 替换 法 得 到 解 ， 再 利用 数学 归纳 法 证 明 解 的 正确 性 。 证明 过 程 
往往 将 递归 式 T(n) 化 为 desired-residual，desired 是 需要 得 到 的 结果 ， 而 residual 是 大 
于 0 的 常数 项 , 这 样 就 可 以 得 到 人 工 (n) 等 于 O(desired)。 也 可 以 直接 使 用 Master 法 进行 
求解 形 如 工 (n) = aT(n/b) 十 了 (n) 的 递归 函数 , 为 此 需要 确定 待 求解 递归 式 属于 Master 
方法 的 哪 一 种 情况 , 然后 直接 得 到 了 (n) 的 渐进 解 。 
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课 后 习题 


习题 4-1 ”现实 生活 中 的 递归 
请 给 出 至 少 两 个 现实 生活 中 使 用 递归 求解 问题 的 实例 。 
习题 42 ”全 排列 
请 给 出 使 用 循环 实现 全 排列 的 算法 ,比较 递归 与 循环 求解 全 排列 的 异同 。 
习题 4-3 ” 汉 诺 塔 问 题 
本 章 给 出 了 汉 诺 塔 问题 的 递归 算法 , 要 求 每 次 只 能 移动 一 个 盘 片 ， 且 移动 过 程 中 大 
的 盘 片 不 能 在 小 盘 片 上 面 。 
(a) 如 果 有 3 个 在 A 柱 的 盘 片 , 请 画 出 每 一 个 盘 片 的 移动 过 程 。 
(b) 采用 代码 4.6 求解 3 个 盘 片 的 汉 诺 塔 问题 , 画 出 计算 机 调用 各 个 函数 的 过 程 。 
(c) 画 出 以 上 问题 函数 执行 的 树 结构 。 


习题 4-4 ”二 分 字符 串 

给 定 正 整数 N, 计算 所 有 长 度 为 N 但 没有 连续 1 的 二 分 字符 。 比如, NN = 2 时 , 输 
出 为 [00, 01, 10]; 当 N = 3 时 , 输出 为 [000, 001, 010, 100, 101]。 
习题 4-5 ”数字 和 分 解 问题 

-个 整数 n 可 以 分 解 为 若干 整数 和 的 形式 , 即 风 = ai + aa 十 … 十 ak， 其 中 有 > 0 

且 ai 大 于 所 有 其 他 ui。 比如 整数 6 可 以 写成 以 下 共 11 种 分 解 : 
6 
5+1 
4+2，4+1+1 
3+3，3+2+1，3+1+1+1 
2+2+2，2+2+1+1，2+1+1+1+1 
1+1+1+1+1+1 

(a) 如 果 n = 5, 那么 共有 几 种 分 解 , 请 写 出 各 个 分 解 式 。 

(b) 给 出 利用 递归 求解 整数 ”的 分 解数 。 
习题 4-6 ”递归 函数 求解 

利用 替换 法 或 者 Master 方法 求解 以 下 递归 式 : 

(a) T(n) = T(n/2)+e 

(b) T(n) = 47(n/2)+n 

(c) T(n) = 47(n/2)+e 

(dD) T(n) = 7(n/2) + 

















第 5 章 排序 与 树 结构 


和 


本 章 学 习 目 标 
。 选择 排序 、 插 入 排序 、 合 并 排序 
。 不同 排序 算法 的 应 用 场景 
。 二 又 搜索 树 的 性 质 ， 以 及 基于 二 又 搜索 树 的 数据 处 理 
。 堆 、 堆 排序 , 利用 堆 结 构 处 理 数据 


5.1 引言 


组 织 数据 的 最 常见 的 方法 就 是 排序 ,排序 就 是 按照 数据 大 小 关系 对 其 进行 组 织 。 比 
如 , 我 们 有 一 份 算法 课程 的 期 末 成 绩 单 ,成 绩 单 的 列表 有 姓名 和 成 绩 。 成绩 单 开始 按照 
姓名 进行 组 织 , 这 意味 着 成 绩 单 中 的 成 绩 并 没有 顺序 关系 。 如 果 按 照 成 绩 对 成 绩 单 进行 
排序 ,也 就 是 把 最 低 分 放 在 第 一 位 ， 次 低 分 放 在 第 二 位 , 依 此 类 推 ， 最 高 分 排 在 最 后 一 
位 ,这 样 就 可 以 得 到 按照 成 绩 进行 排序 的 一 份 成 绩 单 。 此 外 ， 当 我 们 在 播放 一 组 音乐 的 
时 候 , 也 会 用 到 排序 算法 ， 比 如 按照 歌曲 发 布 的 年 份 从 小 到 大 排序 , 或 者 按照 歌手 姓名 
的 字母 顺序 进行 排序 等。 

排序 可 以 说 是 计算 机 算法 中 最 为 常用 的 算法 之 一 。 排 序 算法 之 所 以 有 这 么 高 的 使 用 
频率 , 主要 是 排序 好 的 数据 可 以 更 方便 的 在 其 中 进行 搜索 。 比 如 , 一 组 未 经 排序 的 数据 
A, 要 判断 某 个 数据 k 是 否 在 该 组 数据 A 中 的 算法 其 时 间 复 杂 度 为 O(n)。 如 果 序列 A 
有 序 , 只 需要 O(logn) 的 时 间 就 可 以 判断 k 是 否 在 A 中 ( 见 第 2.5.2 节 )。 

另 一 个 组 织 数据 的 方法 就 是 将 数据 按照 特定 的 结构 进行 存储 。 数据 结构 就 好 比 图 书 
馆 的 书架 , 而 书 则 是 数据 。 图 书馆 之 所 以 用 书架 来 摆 放 图 书 ,主要 是 为 了 方便 读者 容易 
找到 需要 的 书 。 为 此 , 图 书 管理 员 会 先 对 每 本 图 书 进行 编码 , 将 图 书 放置 于 对 应 的 位 置 。 
比如 , 将 计算 机 类 的 书 都 放置 于 编号 为 TP 的 书架 , 将 文学 类 的 书 都 放 在 编号 为 工 的 书 
架 等 等 。 这 样 , 读者 在 寻找 某 本 书 是 否 为 馆藏 书籍 时 , 就 不 需要 浏览 图 书馆 的 所 有 书 , 而 
只 需要 先 确定 该 书 的 类 别 , 然后 到 相应 的 书架 去 查找 即 可 ( 见 第 1.2.2 节 )。 

在 实现 排序 和 数据 结构 的 操作 时 ,本章 依 然 强调 使 用 递归 来 完成 ,以 便 帮助 读者 熟 
练 掌握 使 用 递归 解决 问题 的 方法 。 本 章 首 先 介绍 选择 排序 、 插 入 排序 和 合并 排序 这 三 个 
排序 算法 。 然 后 , 介绍 二 又 搜索 树 与 堆 这 两 个 常见 数据 结构 ， 并 分 别 介绍 如 何 利用 这 两 
个 数据 结构 求解 诸如 飞机 降落 时 间 的 规划 和 数据 合并 等 应 用 问题 。 
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5.2 ”递归 与 排序 


5.2.1 选择 排序 


假设 有 n 个 元 素 的 数组 A[0:n 一 ]], 要 求 按照 元 素 的 大 小 关系 得 到 递增 序列 @， 也 就 
是 A 中 最 小 的 元 素 在 第 0 位 , 最 大 的 元 素 在 第 n 一 1 位 。 

选择 排序 算法 的 思想 就 是 , 对 每 一 个 位 置 从 序列 中 依次 选择 出 在 该 位 置 的 元 素 。 为 
了 理解 方便 , 不 妨 设 书架 上 摆 了 n 本 无 顺序 的 书 , 希望 重新 排列 这 n 本 书 , 让 它们 按照 
书 作者 姓 的 首 个 拼音 按 字母 顺序 进行 排序 。 比 如 作者 唐 二 (Tang) 的 书 应 该 排 在 作者 为 
赵 三 (Zhao) 的 书 前 面 , 因为 字母 表 中 全 在 2 的 前 面 。 

选择 算法 过 程 见 图 5.1, 首先 , 找到 书架 上 名 字 拼 音字 母 顺 序 最 后 的 一 本 书 , 假设 这 
本 书 当前 在 位 置 i。 然后, 将 这 本 书 A 团 (max 指向 的 作者 名 为 Zhang 的 书 ) 与 书架 上 的 
最 后 一 本 书 An-1] (作者 名 为 Ma) 交换 位 置 , 这 样 最 后 一 个 位 置 摆 什 么 书 就 确定 了 。 此 
后 , 在 除了 最 后 一 本 书 之 外 的 剩余 的 n 一 1 本 书 中 , 再 找 出 其 中 名 字 字 母 顺 序 最 后 的 一 
本 书 A[)] (作者 名 为 Tang), 将 它 与 倒数 第 二 位 的 书 An 一 3] (作者 名 为 Li) 交换 位 置 ， 
这 样 倒数 第 二 位 置 的 书 也 确定 了 。 按照 以 上 过 程 , 依次 将 第 nn 一 3, 第 nn 一 4 直到 第 0 个 
位 置 的 书 确定 好 ,这些 步 又 完成 以 后 , 就 能 得 到 按照 书 作者 姓 的 首 个 拼音 字母 进行 排序 
的 书 。 
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图 5.1 选择 排序 过 程 示例 


以 上 排序 过 程 列 含 了 递归 计算 的 过 程 。 不 妨 设 已 经 存在 一 个 算法 叫 select-_sort, 它 
可 以 对 数组 A 中 的 个 元 素 排 序 。 也 就 是 ,select_sort(A[0:n 一 ]), 以 下 等 式 成 立 : 
select_sort(A[0:n — 1]) = select_sort(Al[0:n — 2]) + max(AlO0:n — 1]) 
其 中 , select_sort(A[0:n 一 2]) 是 原 问 题 select_sort(A[0:n 一 1]) 的 子 问题 , max(A[0:n 一 
1]) 则 是 求 出 序列 A[0:n 一 1 中 最 大 的 元 素 , 并 将 它 置 于 select_sort(A[0:n 一 2]) 序列 之 
后 。 这 样 就 可 以 按照 以 上 的 递归 函数 写 出 选择 排序 的 递归 实现 ， 见 代码 5.1。 





人 输出 也 可 以 是 递减 序列 , 除非 特别 说 明 , 本 书 所 有 的 排序 结果 均 为 递增 。 
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代码 5.1 选择 排序 的 递归 实现 





def sel_sort_rec(seq, n): 


if n==0: 
return 
了 3aX-j =n 
for j in range(n): 
if seq[j] > seq[max_j] : 


# 边界 条 件 

# 当前 最 大 元 素 索引 

# 循环 找 出 当前 n 个 数据 中 最 大 的 元 素 
# 如 果 有 更 大 的 值 , 更 新 max_j 


ax-j =j 
# 交换 最 大 值 到 位 置 n 
# 递归 求解 子 问题 


seq[n] ，seq[max-j] = seq[max-j] ，seq[n] 
sel_sort_rec(seq, n-1) 





需要 指出 的 是 , 以 上 选择 排序 的 递归 实现 也 可 以 用 循环 改写 , 得 到 一 个 等 价 实现 ， 
见 代码 5.2。 循环 实现 的 选择 排序 采用 两 重 循环 , 外 循环 用 于 索引 输入 序列 中 的 每 一 个 元 
素 。 注意 循环 是 从 序列 的 最 后 一 个 位 置 开始 , 因此 每 一 次 循环 后 循环 变量 减 1。 第 4 行 一 
第 6 行 的 内 循环 的 功能 是 从 序列 剩余 元 素 中 找 出 最 大 值 。 代码 5.2 第 7 行将 seq 中 位 置 
i 的 元 素 与 max-j 位 置 上 的 元 素 进行 交换 。 





代码 5.2 选择 排序 的 循环 实现 

def sel_sort(seq): 

# i+1...n 是 已 经 排 好 序 的 部 分 
# 目前 最 大 值 的 索引 

# 寻找 最 大 值 


for i in range(len(seq)-1,0,-1): 
max-.j = i 
for j in range(i): 
if seq[j] > seq[max_j]: 
# 如 果 找 到 最 大 值 则 更 新 max_j 
# 交换 最 大 值 到 位 置 n 


max-j = j 
seq[i], seq[max_j] = seq[max_j], seq[i] 


下 面 我 们 来 分 析 选 择 排序 算法 的 时 间 复 杂 度 。 以 代码 5.1 为 例 ， 不妨 设 se- 
lect_sort(A[0:nm 一 1]) 函数 的 执行 时 间 为 T(n)。 那 么 递归 函数 select_sort(Al[0:n 一 2]) 
的 执行 时 间 就 是 T(n 一 1)。T(n) 应 该 等 于 T(n 一 1) 加 上 从 序列 A[0:n 一 1] 中 得 到 最 大 
元 素 的 时 间 O(n)。 因 此 , 可 得 











T(n) T(n—1)+0O(n)=T(n-=1)+on 
= T(n—2)+2cn 
T(n—1—(n—2))+(n— 2)cn = O(n) 











我 们 也 可 以 分 析 循 环 实现 选择 排序 算法 的 时 间 复 杂 度 , 代码 5.2 中 有 两 重 嵌 套 循环 ， 
当 外 循环 索引 i 等 于 n 一 1 时 , 内 循环 的 循环 次 数 为 n。 当 外 循环 索引 i 等 于 nn 一 2 时 ， 
内 循环 的 循环 次 数 为 n 一 1。 随 着 外 循环 的 次 数 依 次 增加 ,内 循环 的 次 数 则 依次 减 小 。 
于 内 循环 判断 语句 的 时 间 复 杂 度 为 常数 , 因此 整个 算法 的 循环 总 次 数 为 


T(n)= (人 公 一 下 十 (一 2 人) 十 十 
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这 是 一 个 等 差 数 列 , 前 nn 项 和 等 于 n(n 十 1)/2。 因此, 循环 实现 的 选择 排序 算法 其 
复杂 度 也 是 T(n) = O(mw)。 需要 指出 的 是 , 尽管 递归 和 循环 实现 的 选择 排序 算法 时 间 复 
杂 度 都 是 O(m?), 但 实际 应 用 中 更 倾向 于 选择 循环 的 实现 。 这 主要 是 因为 递归 实现 方式 
会 导致 函数 频繁 的 进出 运行 栈 ， 从 而 使 得 算法 的 运行 效率 变 慢 。 关 于 函数 运行 栈 的 内 容 ， 
可 以 参考 《编译 原理 》 教 材 中 关于 运行 时 内 存 管理 的 章节 内 容 。 





5.2.2 ”插入 排序 


插入 排序 是 与 选择 排序 类 似 的 一 个 算法 , 灵感 都 来 自 于 日 常生 活 。 如 果 说 选择 排序 
的 算法 思想 来 自 于 整理 书架 上 书 的 位 置 , 那么 插入 排序 算法 灵感 则 来 自 于 抓 扑 克 的 过 
程 。 不 妨 将 序列 A 看 作 是 n 张 牌 面 朝 下 ,， 且 无 序 的 扑克 。 现 在 要 将 这 m” 张 扑 克 一 一 抓 起 
到 手 上 , 每 抓 起 一 张 扑 克 , 就 在 手 上 找到 这 张 扑 克 对 应 的 位 置 。 当 将 n 张 扑 克 抓 完 后 ， 
那么 手 上 就 是 排 好 序 的 扑克 序列 了 。 

插入 排序 算法 执行 过 程 如 图 5.2 所 示 。 初始 有 5 张 无 序 的 扑克 依次 放 在 桌 上 , 第 一 
次 抓 起 第 一 张 扑 克 ， 其 牌 面 为 15。 接着 ,从 桌 上 剩余 的 扑克 中 抓 起 最 上 面 的 扑克 ,也 就 
是 牌 面 为 12 的 扑克 。 然后 将 12 这 张 扑 克 与 手 上 已 有 的 扑克 面值 依次 比较 , 找到 12 这 
张 扑 克 应 该 在 的 位 置 , 它 应 该 摆 在 15 这 张 扑 克 的 前 面 。 当 再 次 从 桌 上 抓 起 牌 面 为 21 的 
扑克 , 应 该 放 在 牌 面 15 的 后 面 。 之 后 ， 则 按照 以 上 流程 完成 所 有 扑克 的 抓 取 , 那么 抓 起 
在 手中 的 扑克 就 是 按照 牌 面 递增 的 序列 。 

需要 特别 强调 的 是 ,算法 执行 过 程 中 手 上 有 的 扑克 总 是 有 序 的 序列 。 这 样 在 比较 抓 
起 的 扑克 与 手 上 已 有 扑克 序列 时 ， 就 可 以 将 抓 起 的 这 张 扑 克 与 手 上 扑克 序列 从 右 到 左 依 
次 进行 比较 。 比 如 , 在 抓 最 后 一 张 牌 面 为 9 的 扑克 时 , 手 上 的 扑克 分 别 为 12、14、15、21。 
这 时 需要 将 9 依次 与 手 上 的 这 些 扑 克 依 次 进行 比较 ,以 便 确定 9 这 张 扑克 的 位 置 。 首 
先 , 9 比 21 小 , 则 将 21 向 右 移动 一 位 。 然后 , 9 比 15、14 和 12 都 小 , 意味 着 15、14 和 
12 依次 向 右 移动 一 位 , 空 出 的 位 置 就 是 扑克 9 应 该 摆 放 的 位 置 。 读者 可 以 看 到 , 插入 算 
法 的 核心 就 是 确定 抓 起 的 扑克 应 该 摆 在 手 上 已 有 扑克 序列 的 哪个 位 置 , 然后 将 抓 起 的 扑 
克 插 入 到 该 位 置 , 这 也 是 为 什么 该 排序 算法 被 称 为 插入 排序 的 一 个 主要 原因 。 
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图 5.2 插入 排序 过 程 示 例 
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习 回 国 


细心 的 读者 不 难 观察 到 ， 以 上 算法 也 蕴含 了 一 个 递归 结构 。 同 样 不 妨 设 已 经 有 一 个 
策略 可 用 于 插入 排序 , 即 insert_sort(A[0:n 一 了]])。 那么 前 n 一 1 个 元 素 显然 可 以 采用 相 
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同 的 策略 获得 排序 的 结果 ,也 就 是 insert_sort(A[0:n 一 2])。 将 第 个 元 素 插入 到 前 面 已 
经 排序 好 的 序列 内 , 就 可 以 得 到 最 终 问题 的 解 , 也 就 是 完成 排序 。 根据 以 上 思想 , 不 难得 
到 插入 排序 的 递归 实现 , 见 代码 5.3。 与 选择 排序 的 递归 实现 不 同 , 插入 排序 求解 子 问题 
的 递归 函数 并 非 在 主 函数 insert_sort( ) 的 最 后 面 , 而 是 在 边界 条 件 之 后 就 出 现 。 这 是 因 
为 插入 排序 的 子 问 题 在 求解 完 后 , 还 需要 继续 查找 随后 抓 起 扑克 应 该 在 该 子 问题 解 中 的 
位 置 , 随后 再 执行 插入 操作 。 

为 了 求解 插入 排序 递归 实现 的 算法 复杂 度 , 不 妨 设 函 数 insert_sort(Al[0:n 一 中) 的 
执行 时 间 为 T(n), 那么 函数 insert_sort(A[0:n 一 3]) 的 执行 时 间 则 为 了 (mn 一 1)。 函 数 
insert_sort(A[0:n 一 2]) 再 加 上 寻找 插入 位 置 的 时 间 ,， 即 代码 5.3 的 第 6 行 到 第 8 行 的 循 
环 时 间 为 O(n), 就 等 于 函数 insert_sort(A[0:n 一 ]) 的 执行 时 间 。 也 就 是 ， 





T(n) =T(n— 1)+O(n) (5.1) 


以 上 递归 式 与 选择 排序 执行 时 间 的 递归 函数 相同 , 因此 不 难得 到 插入 排序 递归 实现 
的 算法 复杂 度 也 是 O(n2)。 


代码 5.3 插入 排序 的 递归 实现 


def ins_sort_rec(seq, n): 


if n==0: 
return # 边界 条 件 
ins_sort_rec(seq，n-1) # 递归 求解 子 问题 
六 于 入 # 最 后 一 个 元 素 找到 合适 位 置 
while j > 0 and seq[j-1] > seq[j]: # 移动 seq[j] 到 下 一 个 位 置 
seq[j-1] seq[j] = seq[j], seq[j-1] # 交换 位 置 
j -= 1 


与 插入 排序 类 似 , 递归 实现 也 可 以 改写 成 一 个 等 价 的 循环 实现 ， 见 代码 5.4。 这 个 实 
现 同 样 包括 一 个 二 重 循环 ， 外 循环 索引 数组 中 的 每 一 个 元 素 , 共有 n 一 1 次 循环 。 内 循 
环 为 当前 元 素 寻找 合适 的 位 置 , 然后 执行 插入 操作 。 

为 了 分 析 代码 5.4 的 时 间 复 杂 度 ,不 妨 考虑 最 坏 情况 下 算法 的 执行 情况 。 此 
时 ， 内 循环 循环 次 数 依次 应 为 1,2,3,… ,n 一 1。 因 此, 代码 5.4 的 执行 时 间 T(n) = 
1 十 2 十 … 十 风 一 1=O(n2)。 


代码 5.4 插入 排序 的 循环 实现 





def ins_sort(seq) : 


for i in range(1,len(seq)): # 0..i-1 已 经 排 好 序 
外 二 证 # 从 已 经 排序 好 的 元 素 开始 
while j > 0 and seq[j-1] > seq[j]: # 为 当前 元 素 找到 合适 位 置 
seq[j-1], seq[j] = seq[j], seq[j-1] # 移动 seq[j] 到 下 一 个 位 置 


j -= 1 
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插入 排序 算法 最 坏 情 况 下 的 时 间 复 杂 度 为 O(n?), 算法 在 最 好 情况 下 的 时 间 复 杂 
是 O(n)。 这 里 的 最 坏 与 最 好 情况 都 是 针对 特定 的 输入 而 言 , 请 读者 自己 给 出 最 好 与 最 坏 
这 两 种 情况 下 输入 序列 的 特征 。 

从 算法 复杂 度 看 , 插入 排序 与 选择 排序 均 为 O(z2), 但 它们 的 应 用 场景 不 尽 相 同 。 
插入 排序 需要 频繁 的 移动 元 素 ,其 移动 次 数 为 O(n2)， 而 选择 排序 移动 的 次 数 仅仅 是 
O(n)。 因 此 , 如果 在 一 个 移动 元 素 相当 耗 时 的 设备 中 排序 (如 磁盘 ), 那么 这 时 选择 排序 
显然 要 优 于 插入 排序 。 如 果 一 个 序列 中 , 大 部 分 数据 均 有 序 (递增 ), 那么 这 时 选择 插入 
排序 更 为 合适 。 这 是 因为 大 部 分 数据 有 序 的 情况 下 , 插入 排序 的 移动 动作 将 大 为 减少 。 

















5.2.3 ”合并 排序 


1945 年 , 现代 计算 机 科学 的 葛 基 人 之 一 汉 * 诺 伊 曼 发 明了 合并 排序 (Merge Sort) 算 
法 , 这 是 一 个 非常 经 典 的 算法 , 在 计算 机 科学 十 大 算法 的 评比 中 总 是 会 占据 一 个 位 置 。 
该 算法 其 实 属于 分 治 算法 ( 见 第 6 章 ), 但 由 于 它 实 现 的 功能 是 数据 的 排序 , 因此 我 们 还 
是 把 它 放 在 本 节 。 合并 排序 的 思想 非常 简单 ,就 是 通过 递归 实现 对 数据 的 分 解 ,然后 经 
日 合并 完成 数据 的 排序 。 

不 妨 设 已 有 一 个 函数 可 以 对 输入 序列 A 进行 排序 , 该 函数 为 merge_sort( )。 既 然 
merge_sort( ) 可 以 对 整个 序列 进行 排序 ,当然 也 可 以 对 序列 的 一 个 部 分 进行 排序 。 我 们 
把 序列 A 一 分 为 二 , 得 到 A[0:n/2] 和 Al[n/2+1:n 一 1。 完成 这 两 个 子 序列 排序 的 函数 
则 是 merge_sort(A[0:mw/2]) 和 merge_sort(A[n/2:n 一 1)。 但 是 , merge_sort(A[0:n/2]) 与 
merge_sort(A[n/2:n 一 1]) 简单 的 连接 并 不 等 于 merge_sort(Al[0:n 一 1])。 

比如 : merge_sort(A[0:n/2])=[7, 12, 18], merge_sort(A[n/2:n—1])=[10, 13, 16]。 此 
时 ，merge_sort(A) 应 该 等 于 [7, 10, 12, 13, 16, 18], 但 显然 [7, 12, 18] 与 [10, 13, 16] 简 
单 结合 并 不 能 得 到 最 终结 果 。 

可 以 通过 设计 一 个 辅助 函数 来 合并 [7, 12, 18] 和 [10, 13, 16] 这 两 个 序列 ， 以 得 到 最 
终 排序 的 结果 [7, 10, 12, 13, 16, 18]。 合 并 排序 的 名 称 ,， 便 是 根据 这 个 辅助 函数 的 合并 功 
能 而 得 到 的 。 

在 实现 合并 这 个 辅助 函数 前 , 我 们 先 按照 前 面 递归 思想 完成 merge_sort 的 主 程序 ， 
见 代 码 5.5。 算 法 实现 的 输入 为 序列 A, 首先 将 A 一 分 为 二 , 即 左 边 一 半 的 元 素 leftA 和 
右边 一 半 的 元 素 rightA。 左 右 两 边 元 素 分 别 调用 merge_sort 对 leftA 和 rightA 进行 排 
序 , 排序 后 的 结果 分 别 存储 于 leftA_Sorted 和 rightA_Sorted。 然 后, 将 这 两 个 排序 好 的 
部 分 经 由 merge 函数 合并 得 到 A 的 有 序 输 出 。 
































代码 5.5 递归 的 合并 排序 算法 





def merge_sort(A) : 
if len(A) <= 1: # 边界 条 件 
return A 
middle = len(A) / 2 
leftA = A[:middle] 


吕 wm ~ a 
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rightA = A[middle:] 


leftA_Sorted = merge_sort(leftA) # 递归 分 解 
rightA_Sorted = merge_sort(TightA) # 递归 分 解 
return merge(leftA_Sorted, rightA_Sorted) # 合并 子 问题 的 分 解 





merge( ) 函数 的 输入 是 两 个 已 经 排序 好 的 序列 ,因此 将 这 两 个 序列 合并 成 一 个 有 序 
序列 时 只 需要 依次 比较 它们 各 自 最 小 的 元 素 即 可 , 合并 计算 的 流程 为 : 

。 比较 这 两 个 子 序列 最 小 元 素 的 大 小 , 并 抽取 其 中 较 小 的 元 素 到 新 的 序列 

。 如 果 某 个 子 序列 的 元 素 抽取 完 , 则 将 另外 剩 下 的 序列 直接 放置 在 新 序列 的 后 面 

根据 以 上 的 描述 , 可 以 得 到 如 代码 5.6 所 示 的 函数 merge( ) 实现 : 


代码 5.6 合并 两 个 已 经 排序 的 序列 


def merge(leftS, rightR): 
i, j=0, 0 
alist = [] 
while i<len(leftS) and j<len(rightR): 
if leftS[i]<rightR[j]: 
alist.append(leftS[i])  # 将 元 素 leftS[i] 加 入 到 序列 alist 中 
i+=1 
else: 
alist.append(rightR[j]) # 将 元 素 rightR[i] 加 入 到 序列 alist 中 
j+=1 
while i<len(leftS):  # 左边 剩余 数据 处 理 
alist.append(leftS[i]) 
i+=1 
while j<len(rightR):  # 右边 剩余 数据 处 理 
alist.append(rightR[j]) 
j+=1 
return alist 


结合 以 上 的 实现 过 程 , 我 们 以 输入 序列 [54,26,93,17,77,31,44,55,20] 为 例 , 可 以 画 出 
根据 合并 排序 算法 完成 排序 的 过 程 , 如 图 5.3 与 图 5.4 所 示 。 根据 第 4.3.1 节 跟 踪 递归 算 
法 的 过 程 , 可知 算法 执行 的 过 程 依然 是 在 如 图 5.3 所 示 的 树 上 做 深度 优先 遍历 。 如 果 我 
们 把 分 解 与 合并 打印 出 来 , 其 结果 为 : 分 解 [54, 26, 93, 17, 77, 31, 44, 55, 20]， 分解 [54， 
26, 93, 17], 分 解 [54, 26], 分 解 [5 各, 合并 [5 各, 分 解 [26], 合并 [26], 合并 [26, 54], 分 解 
[93, 17], 分 解 [93], 合并 [93], 分 解 [17], 合并 [17], 合并 [17, 93], 合并 [17, 26, 54, 93]， 
分 解 [77, 31, 44, 55, 20] 等 等 。 算法 最 后 一 步 就 是 合并 了 [17, 26, 54, 93] 和 [20, 31, 44， 
55], 最 终 得 到 有 序 输出 序列 [17, 20, 26, 31, 44, 54, 55, 96]。 

根据 代码 5.5, 不 妨 设 函 数 执行 时 间 为 T(m)。 边 界 条 件 时 间 复 杂 度 为 O(1), 而 分 解 
A 的 时 间 为 cm。 两 个 递归 求解 子 问题 的 执行 时 间 均 为 了 (nz/2)， 这 是 因为 它们 与 主 函 数 
只 有 输入 规模 存在 不 相同 。 合 并 两 个 排序 好 的 子 序列 时 间 为 crn。 因此 , 合并 排序 算法 的 
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固 四 四 加 团 四 回 


团 四 四 回回 
加 四 团团 四 团 四 回回 


图 5.4 合并 排序 的 合并 子 问 题解 的 示例 


运行 时 间 为 : 
T(n) = 2T(n/2) + O(n) (5.2) 


由 主 分 析 法 不 难得 到 了 T(n) = O(nlogn)。 与 选择 排序 和 插入 排序 相 比 较 , 合并 排序 
的 执行 更 为 高 效 , 其 时 间 复 杂 度 从 O(n?) 变 为 O(nlogn)。 然 而 , 合并 排序 需要 额外 的 空 
间 用 于 存储 合并 的 结果 , 因此 它 不 是 原 位 排序 算法 。 而 选择 排序 和 插入 排序 因为 执行 过 
程 并 不 需要 额外 空间 ,因此 它们 都 是 原 位 排序 算法 。 此 外 ,如果 输 入 序列 有 两 个 相同 的 
元 素 , 合并 排序 能 保证 其 排序 的 结果 是 先 出 现 的 那个 元 素 在 后 出 现 元 素 的 前 面 。 比 如 输 
入 A=[12, 91, 6, 10, 92], 排序 好 以 后 的 结果 为 [6, 91, 92, 10, 12], 也 就 是 原 序列 中 两 个 9 的 
位 置 在 排序 好 的 序列 中 的 相对 位 置 不 变 , 输出 的 序列 中 91 仍 在 9 前 面 。 因此 , 合并 排 
序 是 一 类 稳定 排序 算法 。 
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5.3 ”二 又 搜索 树 


数据 结构 是 为 了 高 效 操作 数据 而 设计 的 存储 数据 的 模式 ， 有 线性 和 非 线 性 这 两 类 常 
见 的 结构 。 线 性 的 数据 结构 有 数组 、 链 表 和 堆栈 等 ,而 非 线性 的 数据 结构 有 二 叉 搜索 树 、 
红 黑 树 、AVL 树 等 。 对 数据 结构 上 的 数据 最 常见 的 操作 有 插入 、 删 除 和 查找 。 其 中 , 插 
入 和 删除 常常 用 于 按照 数据 结构 的 属性 来 组 织 数据 。 数据 结构 的 属性 主要 用 于 描述 数据 
如 何 进 行 组 织 ， 比如: 
e 数组 是 在 物理 存储 单元 上 连续 存储 的 一 组 数据 
。 链表 是 一 种 物理 存储 单元 上 非 连续 、 非 顺序 的 存储 结构 ,数据 元 素 的 逻辑 顺序 是 
通过 链表 中 的 指针 链接 次 序 实现 
。 堆栈 是 一 种 数据 项 按 序 排列 的 数据 结构 ， 只 能 在 一 端 ( 称 为 栈 项 ) 对 数据 项 进行 
插入 和 删除 
。 二 又 搜索 树 中 某 个 结 点 A 的 右 子 结 点 的 值 大 于 等 于 A 的 值 , 而 其 左 子 结 点 的 值 
则 小 于 A 的 值 
下 面 将 以 二 叉 搜索 树 为 例 , 来 说 明 递归 在 二 叉 树 构造 和 数据 操作 中 的 应 用 。 
问题 提出 
2014 年 3 月 8 日 凌晨 2 点 40 分 , 马来西亚 航空 公司 称 一 架 载 有 239 人 的 波音 
777-200 飞机 与 管制 中 心 失去 联系 , 该 飞机 航班 号 为 MH370,， 原 定 由 吉隆 坡 飞 往 北京 。 
由 于 这 架次 飞机 的 乘客 有 许多 中 国人 ,因此 国内 媒体 对 随后 的 营救 做 了 许多 深度 报道 。 
我 们 也 因此 了 解 到 , 原来 飞机 着 陆 是 一 个 非常 复杂 的 通信 过 程 ,驾驶 员 与 飞机 场 的 控制 
塔台 需要 一 系列 的 信息 交互 , 最 终 才 能 完成 着 陆 。 
段 如 现在 需要 给 一 个 很 小 的 飞机 场 开 发 一 个 程序 , 该 程序 的 主要 功能 就 是 管理 飞机 
的 降落 计划 。 由 于 这 个 飞机 场 非常 小 , 因此 它 只 有 一 个 跑道 , 也 就 是 说 某 个 时 刻 只 能 允 
许 一 架 飞 机 降落 。 为 了 确保 安全 , 前 后 两 架 飞 机 降落 需要 一 定 的 安全 时 间 间 隔 ， 设 为 上 。 
段 定 小 机 场 的 mn 次 降落 计划 数据 已 经 保存 。 如 果 某 架 飞 机 的 飞行 员 向 塔台 发 送 一 个 
信号 “塔台 , 是 否 允 许 我 在 t 时 刻 降落 ”。 塔台 便 需 要 运行 我 们 这 个 程序 , 如 果 回 答 是 肯 
定 的 , 那么 将 这 架 飞 机 的 降落 计划 添加 到 原 计 划 当 中 ; 否则 , 将 拒绝 该 架 飞 机 的 降落 请 
求 。 由 于 飞机 运行 需要 非常 高 的 时 效 , 因此 机 场 方面 要 求 程序 能 在 O(logn) 这 一 时 间 内 
给 出 回应 。 
段 设 已 经 存在 的 降落 计划 R=[41, 46, 49, 56]， 其 中 的 数字 表示 各 架 飞 机 降落 时 间 。 
安全 时 间 间 隔 设 为 大 = 3, 且 当 前 时 刻 为 36。 那么, 时 刻 44 这 一 降落 时 间 点 便 不 被 允许 ， 
因为 与 已 有 的 在 46 这 一 时 间 点 的 降落 计划 冲突 (|46 一 44| < 及 。 时 刻 53 的 降落 请 求 则 
可 以 给 予 肯定 的 回复 , 而 时 刻 20 则 不 被 允许 , 因为 它 的 降落 时 间 小 于 当前 时 间 36。 





























代码 5.7 飞机 降落 计划 





1 import time 


2 def air plan schedule array(R, t): 


oo wm wo nm ow 
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now = time.strftime("XH:XM:XS") 


if t < now: # 与 当前 时 间 进 行 比较 
return "error" 
for i in range (len(R)): # 查看 是 否 有 冲突 的 降落 计划 


if abs(t-R[i]) <3: 
return "error" 


R.append(t) # 将 允许 的 降落 时 间 点 插入 到 计划 列表 中 


return "OK" 





设计 求解 以 上 问题 的 程序 似乎 非常 简单 ,只 需要 将 飞机 发 送 的 请 求 降落 时 间 依次 
与 降落 计划 R 中 的 各 个 降落 时 间 进 行 比较 即 可 。 如 果 t 与 降落 计划 R 中 各 个 降落 时 间 
均 没 有 冲突 , 那么 就 同意 这 次 降落 并 将 t 添加 到 R 中 。 否则 , 拒绝 这 次 降落 计划 。 其 实 
现 见 代码 5.7。 

下 面 我 们 来 分 析 代 码 5.7 的 执行 时 间 。 第 3 行 获取 当前 时 间 , 第 4 行 和 第 5 行 的 判 
断 均 为 常数 时 间 复 杂 度 。 第 6 行 的 循环 次 数 为 n, 循环 内 部 条 件 判 断 的 执行 时 间 依 然 是 
常数 , 因此 整个 循环 的 执行 时 间 为 O(n)。 第 9 行将 t 加 入 到 R 中 , 其 时 间 复 杂 度 与 存储 
R 的 结构 相关 。 但 由 于 第 6 行 到 第 8 行 的 循环 就 需要 O(n) 执行 时 间 , 那么 显然 代码 5.7 
从 功能 上 看 满足 了 设计 需求 , 但 其 时 间 效率 显然 没有 达到 设计 要 求 的 O(logn)。 

那么 我 们 该 如 何 改进 代码 5.7 呢 ? 从 以 上 实现 上 不 难 发 现 ， 该 算法 主要 包括 两 个 计 
算 , 一 个 是 t 与 RR 中 各 个 元 素 的 比较 ， 另 外 一 个 就 是 将 插入 到 R 中 。 存储 元 素 最 常见 
的 结构 就 是 数组 , 数组 是 采用 连续 的 单元 存储 数据 , 单元 内 直接 存储 数据 ( 见 图 5.5(a))。 
如 果 R 中 元 素 用 数组 存储 , 那么 执行 比较 计算 需要 遍历 R 中 每 一 个 元 素 , 其 时 间 复 杂 
度 依 然 是 O(n)。 也 许 读者 会 想 如 果 及 中 元 素 有 序 , 这 样 比较 就 可 以 采用 二 分 搜索 ( 见 























2.5.2 节 ), 而 不 需要 遍历 R 中 的 每 一 个 元 素 。 二 分 搜索 的 时 间 复 杂 度 为 O(log n)。 
46 
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56 
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图 5.5 三 个 常见 的 数据 结构 示例 





由 以 上 分 析 知 ,只 需要 让 R 中 数据 保持 有 序 , 就 可 以 提升 比较 计算 的 效率 。 似乎 一 
切 都 朝 着 有 利 的 方面 发 展 , 然而 我 们 还 需要 再 考察 男 外 一 个 插入 计算 的 时 间 复 杂 度 。 由 
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于 数组 是 通过 连续 单元 存储 数据 , 插入 一 个 元 素 需 要 将 插入 位 置 后 的 元 素 进行 移 位 ， 其 
时 间 复 杂 度 为 O(n)。 这 表明 采用 数组 结构 来 存储 飞行 计划 难以 达到 设计 要 求 。 
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图 5.6 链表 插入 操作 示例 


数组 执行 插入 操作 需要 移动 元 素 位 置 , 导致 其 时 间 复 杂 度 是 O(n)。 那 么 有 没有 可 以 
提高 插入 操作 的 数据 组 织 呢 ? 如 果 数 据 是 通过 链条 的 方式 连接 ( 见 图 5.5(b)), 那么 插入 
操作 只 需要 处 理 被 插入 元 素 前 后 两 个 元 素 即 可 ( 见 图 5.6)。 这 样 ,插入 操作 的 时 间 复 杂 
度 就 是 O(1)。 链 表 结 构 中 的 链 式 关系 提高 了 插入 操作 效率 , 但 对 于 比较 计算 还 需要 先 找 
到 链表 的 第 一 个 元 素 , 然后 按照 链接 关系 依次 进行 , 这 个 时 间 复 杂 度 是 O(n)。 因 此 , 改 
为 链表 方式 存储 R 中 元 素 , 可 以 提高 插入 操作 的 时 间 效 率 , 但 比较 计算 的 时 间 复 杂 度 依 
然 为 O(n)。 

以 上 分 析 不 难 发 现 , R 中 各 元 素 采 用 数组 和 链表 的 结构 存储 都 达 不 到 设计 要 求 。 我 
们 需要 一 种 能 在 R 中 可 以 实现 快速 查找 , 又 能 快速 完成 插入 这 一 操作 的 数据 结构 。 能 同 
时 满足 以 上 要 求 的 数据 结构 就 是 二 又 搜索 树 (Binary Search Tree, BST) 。 

BST 与 链表 类 似 , 元 素 存 储 于 独立 的 单元 ,单元 之 间 通 过 指针 来 进行 连接 (如 
图 5.5(c) 所 示 )。 因 此 , 它 可 以 高 效 完成 插入 元 素 这 一 操作 。 此 外 ,对 BST 中 的 任意 结 
点 NN, 它 的 左 子 树 存储 的 元 素 值 均 小 于 N 结 点 存储 的 元 素 值 , 右 子 树 包含 的 元 素 值 则 大 
于 对 结 点 存储 的 元 素 值 。 由 于 这 一 特性 , 在 作 比 较 运 算 时 ,并 不 需要 遍历 其 中 每 一 个 元 
素 就 可 以 快速 找到 请 求 t 的 位 置 。 它 的 查找 过 程 与 二 分 搜索 的 过 程 非常 类 似 。 下 面 将 先 
介绍 BST 的 实现 , 然后 再 分 析 使 用 BST 来 存储 R 中 数据 时 其 比较 和 插入 这 两 个 操作 的 
时 间 复 杂 度 。 





5.3.1 BST 的 实现 


BST 是 一 类 常用 的 数据 结构 , 它 的 每 一 个 结 点 最 多 有 两 个 子 结 点 , 且 右 子 结 点 的 值 
大 于 等 于 父 结 点 的 值 , 而 左 子 结 点 的 值 小 于 父 结 点 的 值 (如 图 5.5(c) 所 示 )。 为 了 实现 
BST, 可 以 将 BST 看 作 是 结 点 的 集合 。 为 此 , 需要 先 定义 BST 的 结 点 。 BST 结 点 类 ( 见 
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代码 5.8) 的 成 员 变量 包括 : 结 点 数据 key,， 指向 父 结 点 的 引用 parent， 指 向 左 子 结 点 的 
引用 left 和 指向 右 子 结 点 的 引用 right。 











代码 5.8 BST 结 点 类 





class BSTnode(object): 
def __init__(self，Pparent，t) : 
Self.key = t 
self.parent = Parent 
self.left = None 
self.right = None 





定义 了 结 点 以 后 , 就 可 以 定义 BST 类 。BST 就 是 结 点 的 集合 , 因此 可 以 定义 成 员 变 
量 为 根 结 点 root 的 类 来 表示 BST, 该 类 的 定义 见 代 码 5.9。 代 码 中 的 class 是 声明 类 的 
关键 字 , 函数 __init__ 则 相当 于 类 的 构造 函数 ,self 指 代 当前 类 的 一 个 对 象 。 


代码 5.9 BST 的 定义 


class BST(object): 
def __-init__(self) : 
self.root = None 


5.3.2 ”插入 新 结 点 


假设 R 中 己 有 的 元 素 均 按照 BST 进行 了 存储 ， 当 接收 到 新 的 请 求 t, 程序 将 从 根 结 
点 开始 比较 上 与 根 结 点 存储 的 值 之 间 是 否 存 在 冲突 , 再 依次 与 BST 上 其 他 结 点 进行 比 
较 , 直到 发 现 冲 突 或 者 没有 冲突 从 而 执行 插入 这 一 操作 为 止 。 

完成 插入 新 结 点 操作 的 递归 实现 见 代 码 5.10。 如 果 t 小 于 根 结 点 的 值 ， 那么 将 从 根 
结 点 的 左 子 结 点 开始 , 采用 与 根 结 点 一 样 的 策略 去 寻找 t 的 位 置 (代码 5.10 第 10 行 )。 
与 此 类 似 , 如 果 t 大 于 根 结 点 的 值 ,， 那么 则 从 根 结 点 的 右 子 结 点 开始 ， 也 采用 与 根 结 点 
一 样 的 策略 去 寻找 tt 的 位 置 (代码 5.10 第 16 行 )。 


代码 5.10 BST 结 点 的 插入 函数 





def insert(self, t): 
if abs(t-self .key)<3: # 发 现 冲 突 


print("Insert error!") 


return 
if t < self.key: # 往 左 子 树 
if self.left is None: # 没有 左 子 结 点 
self.left = BSTnode(self, t) # 当前 结 点 作为 左 子 结 点 


return self.left 


else: 
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return self.left.insert(t) # 递归 
else: 
if self.right is None: # 没有 右 子 结 点 
self.right = BSTnode(self，t) # 当前 结 点 作为 右 子 结 点 
return self.right 
else: 


return self.right.insert(t) # 递归 





假如 最 开始 时 BST 没有 任何 结 点 (如 图 5.7(a)), 需要 插入 的 请 求 时 间 分 别 为 
[46, 39, 49, 44, 51]。 当 请 求 += 46 时 ,由 于 BST 上 还 没有 任何 结 点 , 因此 值 为 46 的 结 
点 将 成 为 BST 的 根 结 点 (如 图 5.7(b))。 当 第 二 个 请 求 t= 39 到 达 后 , 将 比较 当前 时 间 
与 根 结 点 的 大 小 关系 ,由 于 39 小 于 46, 则 将 值 为 39 的 结 点 作为 根 结 点 的 左 子 结 点 (如 
图 5.7(c))。 当 收 到 第 三 个 请 求 上 = 49 后 , 该 结 点 大 于 根 结 点 46, 因此 将 该 请 求生 成 根 结 
点 的 右 子 结 点 (如 图 5.7(d))。 当 随后 的 两 个 请 求 上 = 44 和 t= 51 分 别 送 达 后 , 将 构成 


如 图 5.7(f) 所 示 的 BST。 
[elo Tel 














操作 BST 操作 BST 
初始 Nil 插入 46 
a (b) 
插入 39 
插入 49 
插入 44 插入 51 和 四 
(e) 全 


图 5.7 BST 插入 结 点 示例 








现在 我 们 来 分 析 采 用 BST 完成 飞机 场 调度 任务 算法 的 时 间 复 杂 度 。 首 先 ， 由 于 
BST 结 点 值 大 小 所 具有 的 特性 , t 并 不 需要 与 R 中 所 有 元 素 依次 比较 。 比 较 的 次 数 最 多 
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就 是 BST 树 的 高 度 , 也 就 是 O(logn) @. 其 次 , 将 结 点 加 入 到 BST 中 的 操作 与 数组 结构 
不 同 , 并 不 需要 移动 R 中 元 素 。 这 一 操作 与 链表 结构 的 操作 类 似 , 只 需要 处 理 插 入 结 点 
的 父 结 点 与 该 结 点 的 子 结 点 ， 其 时 间 复 杂 度 为 0(1)。 因 此 , 采用 BST 来 存储 及 可 以 同 
时 实现 快速 查找 和 插入 , 其 总 的 时 间 复杂 度 为 O(logn)。 


5.3.3 ”BST 上 查找 


当 将 数据 按照 BST 结构 进行 组 织 后 , 其 他 最 常见 的 操作 就 是 查找 某 个 值 val 是 否 在 
该 BST 上 。 查找 非常 简单 ,只 需要 从 根 结 点 开始 执行 函数 find(x), x 为 BST 上 的 结 点 。 
将 x 的 值 与 val 比较 , 如 果 相 等 则 返回 True。 如 果 val 比 当 前 结 点 的 值 小 , 则 从 x 的 左 
子 树 进行 查找 , 即 递归 调用 find(x.left)。 如 果 val 比 当前 结 点 的 值 大 , 则 从 x 的 右 子 树 进 
行 查找 ,也 就 是 递归 调用 find(x.right)。 直 到 BST 的 叶子 结 点 ,， 如果 依 然 没 有 找到 等 于 
val 的 结 点 , 则 返回 False。 当 查找 到 某 个 结 点 , 其 左 子 结 点 和 右 子 结 点 均 不 存在 , 该 结 点 
就 是 叶子 结 点 。 

除了 find() 外 , 还 可 以 查找 BST 上 的 最 小 值 , 即 fnd_min( )。BST 上 结 点 值 最 小 
左 子 , 直到 某 个 没有 左 子 的 结 点 为 止 , 该 结 点 就 是 BST 上 值 最 小 的 结 点 。 

从 以 上 find() 和 find_min() 这 两 个 函数 的 实现 不 难 发 现 , 它们 都 充分 利用 了 BST 
上 结 点 的 性 质 , 即 任意 结 点 x, 其 左 子 树 上 的 任意 结 点 的 值 均 小 于 x 的 值 , 而 右 子 树 上 任 
意 结 点 的 值 均 大 于 x 的 值 。 因此 , 最 坏 的 执行 时 间 都 与 BST 的 高 度 有 关 , 即 O(h)。 

假如 给 定 R, 且 其 中 所 有 元 素 均 按 照 BST 组 织 , 现在 希望 查找 比 结 点 x 次 大 的 结 点 ， 
即 next_larger(x)。 如 图 5.8 所 示 , R= [46, 39, 49, 51, 44]， 当 x=49, next_larger(x)=51。 
按照 BST 结构 特性 ， 比 结 点 x 大 的 结 点 应 该 在 x 的 右 子 树 上 。 由 于 是 返回 次 大 的 结 点 ， 
因此 返回 右 子 树 上 的 最 小 结 点 就 可 以 。 然而, 对 于 没有 右 子 树 的 结 点 , 比如 图 5.8 上 结 点 
44, 其 次 大 结 点 是 根 结 点 46。 那 么 该 如 何 得 到 没有 右 子 结 点 的 次 大 结 点 呢 ? 





图 5.8 查找 次 大 结 点 


对 于 类 似 于 图 5.8 上 结 点 44 这 种 情况 , 其 次 大 结 点 应 该 是 该 结 点 上 一 级 结 点 中 , 第 
一 次 发 生 左 转 的 结 点 。 其 算法 实现 见 代 码 5.11。 代码 第 2 行 判断 结 点 x 是 否 存 在 右 子 结 





@ 严格 来 说 , 时 间 复杂 度 是 O(h), h 为 BST 的 高 度 。 当 BST 是 平衡 树 时, h 二 O(log n)。 
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点 。 如果 x 有 右 子 结 点 , 则 x 的 次 大 结 点 就 是 x 结 点 的 右 子 树 中 最 小 的 结 点 , 代码 5.11 
第 3 行 的 函数 minimum(node) 返回 结 点 node 结 点 及 其 子 树 的 最 小 结 点 ; 如 果 x 没有 右 
子 结 点 , 则 得 到 该 结 点 的 父 结 点 y。 代 码 第 6 行 到 第 7 行 的 循环 为 从 x 结 点 向 上 遍历 各 
个 结 点 , 直到 第 一 次 发 生 左 转 的 结 点 为 止 。 


代码 5.11 查找 BST 上 次 大 结 点 





def next_larger(x): 

if x.right not NIL: 
return minimum(x.right) 

else: 
y = parent (x) 

while y not NIL and x = right(y) # 找到 第 一 次 发 生 左 转 的 结 点 
x =y; y= parent(y) 

return y; 


5.3.4 二叉树 修剪 

上 节 我 们 主要 考查 了 在 BST 上 查找 特定 的 结 点 , 本 节 则 考查 对 BST 的 修剪 。 还 是 
以 机 场 降落 时 间 规划 为 例 , 假如 现在 只 需要 保留 降落 计划 R 中 某 一 段 的 降落 时 间 ， 其 余 
降落 时 间 都 取消 。 由 于 R 中 的 各 个 降落 时 间 是 按照 BST 存储 ,因此 需要 将 范围 外 的 其 


他 时 间 结 点 都 删除 。 当 然 , 不 仅仅 是 删除 结 点 , 还 需要 在 删除 结 点 后 让 剩余 结 点 依然 是 
以 BST 结构 存储 。 


以 上 问题 就 是 要 按照 给 定 的 两 个 值 min 和 maz 对 BST 进行 修 前 ， 修 前 后 的 树 首 
先 必须 仍然 是 BST， 且 所 有 结 点 的 值 均 在 min 与 maz 之 间 。 比 如 , 图 5.9 左 图 所 示 的 
BST 在 按照 min=5 和 maz=13 修剪 后 得 到 如 图 5.9 右 图 所 示 的 BST。 


图 5.9 BST 的 修剪 


在 介绍 修剪 之 前 , 我 们 先 简单 介绍 修剪 算法 中 用 到 的 BST 遍历 算法 。 遍历 就 
是 不 重复 、 无 遗漏 的 走 过 每 一 个 BST 上 的 结 点 。 最 为 常用 的 遍历 有 宽度 优先 (7.4 
节 )、 深 度 优先 (7.5 节 )、 前 序 和 后 序 遍 历 等 。 树 修剪 需要 用 到 后 序 遍 历 (Post-Order 
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Traversal, POT)， 它 的 遍历 过 程 简单 说 就 是 左 、 右 、 结 点 (Left-Right-Node, LRN)。 按 
照 LRN 的 顺序 ， 当 前 结 点 N 是 否 遍 历 需要 经 历 如 下 过 程 : 

。 如 果 结 点 N 有 左 子 结 点 , 则 先 处 理 其 左 子 结 点 

。 如 果 结 点 N 没有 左 子 结 点 , 则 看 该 结 点 是 否 有 右 子 结 点 。 如 果 N 有 右 子 结 点 , 则 

需要 处 理 该 右 子 结 点 

。 如 果 结 点 N 没有 右 子 结 点 , 则 遍历 结 点 N 

POT 的 执行 过 程 如 图 5.10 所 示 。 首先 , 从 根 结 点 8 开始 ， 当 前 是 否 遍 历 该 结 点 需 
要 首先 判断 结 点 8 是 否 有 左 子 结 点 。 由 于 8 有 左 子 结 点 3, 则 处 理 该 左 子 结 点 3。 同样， 
结 点 3 是 否 遍历 同样 需要 看 该 结 点 是 否 存 在 左 子 结 点 。 显 然 结 点 3 有 左 子 结 点 1， 则 算 
法 执行 到 结 点 1。 结 点 1 没有 左 子 结 点 , 也 没有 右 子 结 点 , 因此 该 BST 第 一 个 遍历 到 的 
结 点 就 是 1。 结 点 1 的 父 结 点 是 3, 结 点 3 的 左 子 结 点 处 理 完 ， 则 需要 考察 该 结 点 是 否 有 
右 子 结 点 。 结 点 3 的 右 子 结 点 为 6, 在 处 理 结 点 6 时 , 同样 按照 LRN 的 过 程 。 结 点 按照 
后 序 先后 遍历 的 结 点 依次 是 1，4, 7, 6, 3, 13, 14, 10, 8。 读者 可 以 看 到 , 根 结 点 在 最 后 
遍历 到 , 因为 按照 后 序 遍 历 算法 , 需要 先 遍 历 完 其 左 子 结 点 , 再 遍历 完 其 右 子 结 点 , 最 后 
才 到 当前 结 点 。 





(1) (6) (14) Left, Right, Node 
© (了 © 后 续 饥 历 : 1, 4, 7, 6, 3, 13, 14, 10, 8 


图 5.10 后 序 遍 历 树 


修 前 BST 时 , 按照 POT 依次 处 理 每 一 个 结 点 。 之 所 以 采用 POT, 是 因为 在 判断 当 
前 结 点 是 否 需要 修剪 时 ， 当 前 结 点 的 左 子 结 点 和 右 子 结 点 都 已 经 修剪 过 。 

对 每 一 个 结 点 , 根据 它 的 值 与 min 和 maz 的 关系 来 确定 是 否 进行 修剪 : 

e 如 果 当 前 遍历 结 点 的 值 在 min 和 maz 之 间 (min < node < mazx ), 那么 该 结 点 





不 需要 做 任何 变动 

。 如 果 当 前 结 点 小 于 min 的 值 , 那么 该 结 点 所 有 左 子 结 点 值 都 应 该 小 于 min, 但 
其 右 子 结 点 与 min 的 大 小 关系 并 不 能 确定 。 因此, 此 时 将 该 结 点 的 右 子 结 点 返回 
给 当前 结 点 的 父 结 点 

。 如 果 当 前 结 点 值 大 于 maz, 则 只 需 返 回 该 结 点 的 左 子 结 点 给 其 父 结 点 即 可 


修剪 BST 的 算法 实现 见 代码 5.12。 代 码 第 4 行 与 第 5 行为 递归 ,保证 修剪 过 程 按 
照 后 序 遍 历 BST 所 有 结 点 。 
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代码 5.12 修剪 BST 的 递归 实现 





def trimBST(tree，minVal ，maxVal) : 
if not tree: 
return 
tree.left=trimBST(tree.left, minVal, maxVal) # 痒 归 调用 ， 后 序 遍 历 左 子 结 点 
tree.right=trimBST(tree.right, minVal, maxVal)  # 说 归 调 用 ,后 序 斋 历 右 子 结 点 
if minVal<=tree.val<=maxVal: 
return tree 
if tree.val<minVal: 
return tree.right 
if tree.val>maxVal: 
return tree.left 


按照 代码 5.12 对 BST 进行 修剪 的 过 程 示意 见 图 5.11， 此 时 min=5, maz=13。 按 
照 后 续 遍 历 , 算法 首先 访问 结 点 1, 该 结 点 小 于 min， 因 此 直接 删除 该 结 点 。 下 个 访问 的 
结 点 为 4, 同样 应 该 删除 该 结 点 。 当 算法 再 依次 访问 到 结 点 7 和 结 点 6, 由 于 这 两 个 结 点 
的 值 在 修剪 范围 外 , 因此 不 需要 做 其 他 操作 。 当 访问 结 点 3 时 , 该 结 点 应 该 被 删除 , 且 值 
为 结 点 3 的 父 结 点 应 该 指向 结 点 3 的 右 子 结 点 ,也 就 是 结 点 8 应 该 指向 结 点 6。 算 法 下 
-个 访问 的 结 点 13 不 在 删 减 范围 ,同样 不 需要 进一步 的 处 理 。 当 访问 结 点 14 时 , 该 结 





点 应 该 被 删除 , 此 外 该 结 点 的 父 结 点 10 指向 结 点 14 的 左 子 结 点 13。 
© (8) (8 
加 人 3) 四 GI 四 
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图 5.11 修剪 BST 示例 


修剪 树 的 算法 实现 是 递归 , 但 它 的 时 间 复 杂 度 并 不 需要 列 出 递归 式 后 再 进行 求解 。 
这 是 因为 该 算法 遍历 了 树 上 每 一 个 结 点 , 因此 其 时 间 复 杂 度 为 O(n), n 为 结 点 个 数 。 
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5.4 堆 


5.4.1 ” 堆 化 操作 


当 需 要 频繁 的 使 用 序列 的 最 小 值 或 最 大 值 时 , 就 有 可 能 需要 考虑 使 用 堆 (Heap) 这 个 
数据 结构 来 组 织 序列 。 堆 是 一 类 常见 的 数据 结构 ,在 求 最 短路 径 (8.4 节 ) 和 最 小 生成 
树 (8.5 节 ) 时 都 会 用 它 来 优化 算法 实现 。 此 外 , 还 可 以 基于 堆 实 现 对 序列 的 排序 。 

堆 数 据 存 储 于 数组 , 但 它 的 组 织 结构 可 以 看 作 是 一 棵 完全 二 叉 树 。 完 全 二 叉 树 首 
先是 二 叉 树 D， 即 每 个 结 点 最 多 只 有 两 个 子 结 点 。 此外， 完全 则 意味 着 只 有 二 叉 树 最 下 
面 的 两 层 结 点 的 度 能 够 小 于 2, 并 且 最 下 面 一 层 的 结 点 都 集中 在 该 层 最 左边 的 若干 位 
置 。 堆 除了 是 完全 二 叉 树 外 ,还 必须 满足 最 大 (或 最 小 ) 堆 性 质 ， 即 堆 上 任意 结 点 的 值 
均 大 于 (小 于 ) 该 结 点 所 有 子 结 点 的 值 。 图 5.12 就 是 一 个 典型 的 最 大 堆 结 构 @, 序列 
[16,14,10,8,7,9,3,2,4,1] 数据 存储 于 数组 中 , 但 这 个 序列 表现 出 的 组 织 结构 是 一 颗 完全 二 
叉 树 ， 且 树 上 每 一 个 结 点 均 满 足 最 大 堆 性 质 , 如 结 点 14, 该 结 点 的 所 有 子 结 点 [8,7,2,4,1] 
的 值 均 小 于 14。 
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图 5.12 最 大 堆 





为 什么 存储 于 数组 中 的 数据 其 组 织 结构 是 一 棵 树 ? 这 是 因为 数组 中 数据 相互 之 间 的 
联系 并 不 是 线性 , 而 是 通过 以 下 索引 计算 来 实现 的 : 
。 树 的 根 结 点 : 数组 的 第 一 个 元 素 
结 点 i 的 父 结 点 索引 : parent(i)=i/2 
结 点 的 左 子 结 点 索引 : left(i)=2i 
。 结 点 i 的 右 子 结 点 索引 : right(i)=2i 十 1 


比如 图 5.12 中 值 为 14 的 结 点 ， 它 在 数组 中 的 索引 为 2。 该 结 点 的 父 结 点 索引 就 是 
2/2=1, 也 就 是 图 5.12 中 值 为 16 的 结 点 ; 它 的 左 子 结 点 在 数组 中 的 索引 为 2x2=4, 也 


就 是 值 为 8 的 结 点 ; 其 右 子 结 点 在 数组 中 的 索引 为 2x2+1=5,， 即 值 为 7 的 结 点 。 因 此 ， 
与 BST 各 个 数据 离散 的 存储 于 内 存 中 不 同 , 堆 中 数据 可 存储 于 连续 的 内 存 区 域 。 通 过 以 
上 数组 索引 的 运算 , 建立 数组 元 素 的 树 状 结构 。 当 堆 元 素 个 数 为 n 时 ,其 对 应 的 树 的 高 
度 就 是 O(logn)。 











@ 二 又 树 与 二 又 搜索 树 BST 并 不 一 样 ,二叉树 并 不 规定 结 点 之 间 的 关系 。 
@ 除非 特别 说 明 , 书 中 的 堆 均 指 最 大 堆 。 
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任意 给 定 n 个 数 , 且 使 用 数组 存储 , 这 组 数 此 时 并 不 能 保证 一 定 符合 堆 性 质 。 如果 
某 个 结 点 违反 了 最 大 堆 性 质 , 就 需要 调用 函数 max_heapify( ) 来 改变 该 结 点 位 置 ， 从 而 
使 得 该 结 点 满足 堆 性 质 。 当 i 表示 结 点 的 索引 时 ,函数 max_heapify(i) 的 计算 过 程 为 : 


。 判断 结 点 i 与 它 两 个 子 结 点 大 小 关系 , 找 出 最 大 的 子 结 点 , 交换 结 点 i 与 该 子 结 


。 交换 至 新 位 置 的 结 点 i 仍 有 可 能 违反 最 大 堆 性 质 , 需 递 归 调 用 函数 max_heapify(i)， 
直到 结 点 i 满足 最 大 堆 性 质 
根据 以 上 设计 , 可 以 构造 如 代码 5.13 所 示 的 BinHeap 类 , 该 类 用 变量 heapList 
来 存储 堆 数据 ，currentSize 来 标示 当前 堆 的 大 小 。 这 两 个 变量 在 函数 __init__ 中 初始 
化 。BinHeap 类 成 员 函 数 max_heapify_rec(self, i) 是 通过 递归 来 实现 对 结 点 i 的 堆 
化 ( 见 代码 5.14)， 而 成 员 函 数 maxChild(self, i) 则 是 找 出 结 点 i 与 它 子 结 点 中 的 最 大 结 
点 ( 见 代 码 5.15)。 


代码 5.13 类 BinHeap 的 定义 


class BinHeap: 
def __init__(self): 
self .heapList = [0] 
self.currentSize = 0 


代码 5.14 堆 化 函数 


def max_heapify_rec(self ,i): 
if (i * 2) <= self.currentSize: # 存在 子 结 点 

mc = self.maxChild(i) # 找到 当前 结 点 与 子 结 点 中 最 大 的 结 点 

if self.heapList[i] < self.heapList[mc]:  # 将 当前 结 点 与 最 大 值 结 点 交换 
tmp = self.heapList[i] 
self.heapList[i] = self.heapList[mc] 
self.heapList[mc] = tmp 
self .max_heapify_rec(mc) # 递归 调用 ， 继 续 处 理 最 大 结 点 mc 





代码 5.15 当前 结 点 与 子 结 点 间 最 大 结 





def maxChild(self ,i): 

leftchild = i*2 

rightchild = i*2+1 

if leftchild <= self.currentSize and 
— self.heapList[leftchild]>self .heapList[i]: 
largest = leftchild 

else: 
largest = i 

if rightchild <= self.currentSize and 


— self.heapList[rightchild]>self .heapList [largest]: 
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largest = rightchild 


return largest 





下 面 将 根据 具体 实例 来 演示 函数 max_heapify_rec( ) 的 执行 过 程 。 假设 输 入 数据 
A=[16, 4, 10, 14, 7, 9, 3, 2, 8, 1], 如 图 5.13(a) 所 示 。 考 察 索引 i = 2, 即 值 为 4 的 这 个 
结 点 , 它 显然 违反 了 最 大 堆 性 质 。 根据 函数 maxChild( ), 比较 i=2,i=4 和 i=5 这 三 





个 结 点 , 它们 中 结 点 值 最 大 的 是 值 为 14 的 结 点 i = 4。 根据 第 5 行 到 第 7 行 代码 , 交换 
结 点 4 与 结 点 14 位 置 , 如 图 5.13(b) 所 示 。 此 时 算法 还 没有 结束 ， 因 为 结 点 4 移动 到 新 











的 位 置 后 , 并 不 意味 着 它 一 定 满足 最 大 堆 性 质 ,此 时 会 递归 调用 max_heapify_rec() 函 
数 继续 处 理 结 点 4。 直 到 结 点 4 完全 满足 最 大 堆 性 质 ， 函数 max_heapify_rec( ) 的 执行 
才 结 束 ， 从 而 得 到 如 图 5.13(c) 所 示 的 结果 。 








图 5.13 max_heapify 执行 示例 


尽管 函数 max_heapify_rec( ) 是 递归 实现 , 但 在 求解 函数 max_heapify_rec( ) 的 时 
间 复 杂 度 时 也 不 需要 列 出 递归 式 。 这 是 因为 ， 在 最 坏 情况 下 函数 执行 的 次 数 应 是 堆 树 的 
高 度 。 因 此 , 函数 max_heapify_rec( ) 的 执行 时 间 复 杂 度 为 O(h), h 为 堆 树 高 度 。 


5.4.2 ”构造 堆 


有 了 堆 化 函数 ， 就 可 以 很 容易 地 构造 堆 。 在 构造 堆 时 ， 从 堆 树 的 叶子 结 点 开始 ， 
按照 自 底 向 上 逐 层 处 理 每 个 结 点 ， 这 可 以 保证 结 点 的 堆 化 过 程 不 会 发 生 重复 。 代 码 
5.16 先 从 第 一 个 有 叶子 的 结 点 mid 开始 , 直到 堆 的 根 结 点 为 止 ， 依 次 调用 堆 化 函数 


Iax_heapify_rec( )。 





代码 5.16 构造 堆 函 数 





def buildHeap(self ,alist): 


mid = len(alist) // 2 # 得 到 第 一 个 有 叶子 结 点 的 索引 
self.currentSize = len(alist) # 初始 化 堆 大 小 
self.heapList = [0] + alist[:] # 初始 化 堆 元 素 
while (mid > 0): 

self .max_ heapify_rec(mid) # 调用 堆 化 函数 


mid = mid -1 
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需要 特别 注意 的 是 , 算法 并 不 需要 从 最 后 一 个 元 素 开始 处 理 , 而 是 从 第 n/2 个 元 素 
开始 进行 计算 。 这 是 因为 第 nm/2 十 1 个 结 点 直到 第 nn 个 结 点 均 为 叶子 结 点 , 而 单个 叶子 
结 点 一 定 满足 堆 的 性 质 。 

如 果 给 n 个 元 素 建 堆 , 那么 如 代码 5.16 所 示 的 算法 复杂 度 是 多 少 ? 不 妨 设 每 一 层 有 
1 个 结 点 ， 每 一 结 点 循环 的 次 数 就 是 该 层 结 点 直到 叶子 结 点 的 层 数 。 最 下 一 层 的 结 点 数 
为 n/2, 倒数 第 二 层 的 结 点 数 为 n/4, 这 一 层 每 个 结 点 用 堆 化 函数 走 到 叶子 结 点 的 步 数 
为 1。 倒 数 第 三 层 的 结 点 数 为 mw/8， 该 层 每 个 结 点 调用 堆 化 函数 走 到 叶子 结 点 的 步 数 为 
2。 根 结 点 数 为 1, 它 走 到 叶子 结 点 的 步 数 为 log nm。 因此, 可 得 建 堆 的 时 间 复 杂 度 为 : 











T(n)=n/4(lc) +n/8(2c) +n/16(3c)+:…:+1(logn x c) (5.3) 
不 妨 设 n/4 = 2*， 上 式 变 为 : 
T(n) = c2*[1/2° + 2/2! +3/22+.…(k+1)/2*] (5.4) 


式 (5.4) 括号 中 序列 和 的 上 界 为 一 个 常数 , 因此 建 堆 的 算法 复杂 度 为 O(n)。 

图 5.14 表示 如 何 构 造 堆 的 过 程 , 输入 堆 序 列 为 [3, 1, 2, 4, 9, 16, 10, 14, 7, 8]。 叶子 
结 点 8, 7, 14 均 满足 堆 性 质 , 算法 从 结 点 9 开始 。 结 点 9 满足 堆 性 质 , 无 须 做 任何 改变 。 
结 点 4 不 满足 堆 性 质 , 调用 函数 max_heapify_rec( ) 让 结 点 4 满足 堆 性 质 。 依 此 过 程 ， 
处 理 完 根 结 点 元 素 后 就 得 到 输入 序列 的 堆 结构 。 这 时 , 序列 的 最 大 值 在 堆 树 的 根部 ， 输 
出 的 堆 序列 为 [16, 14, 10, 7, 9, 2, 3, 4, 1, 8]。 需 要 注意 的 是 , 尽管 堆 树 的 根 结 点 值 最 大 ， 
但 堆 序 列 并 非 是 有 序 的 序列 。 
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图 5.14 建 堆 示 例 
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5.4.3 ” 堆 排 序 


一 组 序列 按照 堆 进 行 组 织 后 ， 由 堆 的 性 质 可 知 , 堆 的 根 结 点 是 堆 树 中 值 最 大 的 元 
素 。 因此, 可 以 从 堆 中 不 停 地 删除 根 结 点 来 完成 排序 。 在 删除 根 结 点 后 , 为 了 保持 堆 的 性 
质 , 还 需要 从 堆 序 列 中 选择 一 个 元 素 插入 到 根 结 点 的 位 置 。 为 此 , 可 将 堆 结 构 根 结 点 及 
与 堆 序列 的 最 后 一 个 元 素 卫 交换 。R 被 交换 到 堆 序 列 的 末 位 后 , 再 将 它 从 堆 中 删除 。 由 
于 R 是 最 后 一 个 元 素 , 因此 删除 R 不 改变 堆 中 其 他 元 素 的 性 质 。 结 点 卫 被 交换 到 根 结 
点 后 , 则 有 可 能 会 违背 堆 性 质 , 因此 需要 调用 函数 max_heapify_rec( ) 让 该 结 点 满足 堆 
性 质 。 

堆 排 序 的 过 程 可 见 图 5.15。 首先, 将 堆 树 根 结 点 16 和 堆 序 列 的 末 位 元 素 进行 交换 。 
再 从 堆 中 删除 结 点 16, 也 就 是 将 堆 的 大 小 减 小 1 位 。 然后 调用 堆 化 函数 , 让 当前 根 结 点 
8 满足 堆 性 质 。 得 到 新 堆 结 构 后 , 其 根 结 点 为 14, 再 次 交换 结 点 14 与 堆 末 位 元 素 1 之 间 
的 位 置 。 为 了 让 当前 根 结 点 1 满足 堆 性 质 , 需 再 次 调用 堆 化 函数 。 至此, 得 到 的 输出 结果 
为 14, 16。 依照 代码 5.17 所 示 过 程 ,完成 对 所 有 堆 元 素 的 排序 。 因 此 , 堆 排 序 的 过 程 就 
是 不 停 交换 结 点 ， 删除 结 点 , 再 堆 化 的 过 程 。 
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图 5.15 ” 堆 排 序 示 例 


堆 排序 算法 的 实现 见 代 码 5.17。 由 于 Python 有 内 建 的 堆 函 数 ， 如 heapify( )， 
heappush( ) 和 heappop( ) 等 ,可 利用 它们 来 实现 排序 。 代 码 5.17 中 的 列表 变量 sortedh 
用 于 存储 排序 后 的 结果 ,heappop( ) 删除 堆 的 根 结 点 , 并 将 它 添加 到 列表 sortedh 中 。 





代码 5.17 堆 排 序 





1 from heapq import heappop, heapify 
2 def heapsort(alist): 


吕 wo nm aw 
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sortedh = [] 

# 为 alist 构造 堆 

heapify(alist) 

While alist: 
# 提取 堆 根 结 点 元 素 
sortedh.append (heappop(alist)) 


return sortedh 





下 面 来 分 析 堆 排序 的 时 间 复 杂 度 。 堆 根 结 点 被 删除 后 , 为 了 保持 完全 二 又 树 特性 , 将 
堆 中 最 后 一 个 元 素 插入 到 根 结 点 位 置 , 该 结 点 需要 保持 堆 性 质 , 最 多 执行 步 数 为 logn。 
1 于 需要 删除 n 次 结 点 , 因此 堆 排 序 算法 复杂 度 为 O(nlogn)。 




















5.4.4 合并 有 个 有 序 序列 


堆 结构 具有 非常 特殊 的 性 质 , 即 最 大 /最 小 元 素 总 是 在 堆 树 的 根 结 点 。 因此, 在 实际 
问题 中 如 果 需 要 频繁 用 到 序列 的 最 大 或 最 小 元 素 , 就 会 考虑 用 堆 来 组 织 序列 。 下 面 我 们 
考察 如 何 利 用 堆 结构 来 优化 合并 大 个 有 序 序列 这 一 问题 。 

假如 有 上 大 个 序列 , 每 一 个 序列 都 有 n 个 元 素 且 每 一 序列 内 元 素 均 有 序 。 现 要 将 这 大 
个 序列 合并 成 一 个 有 序 序 列 (如 图 5.16 所 示 )。 最 简单 的 办 法 就 是 将 这 上 个 序列 先 合并 
成 1 个 序列 , 然后 进行 排序 , 这 种 方法 的 时 间 复 杂 度 为 O(nk log nk)。 

但 是 以 上 简单 的 算法 并 没有 用 到 大 个 序列 原来 就 有 序 这 一 信息 ,因此 我 们 可 以 尝试 
进一步 改进 算法 。 由 于 大 个 序列 各 自 有 序 , 每 一 次 从 大 个 序列 的 当前 最 小 元 素 里 找 出 最 
小 的 那个 元 素 , 将 这 个 元 素 作为 输出 。 由 于 从 大 个 元 素 中 找 最 小 的 元 素 需 要 执行 的 步 数 
为 O(k), 共有 nk 个 元 素 。 因 此 , 改进 后 的 算法 复杂 度 为 O(nk?)。 
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图 5.16 合并 上 个 有 序 序列 
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分 析 以 上 改进 的 算法 不 难 发 现 , 每 次 都 是 取 最 小 的 元 素 作 为 输出 。 这 让 我 们 考虑 可 
以 使 用 堆 来 组 织 这 大 个 元 素 , 算法 的 流程 如 下 : 
(1) 创建 大 小 为 nk 的 输出 数组 ; 
(2) 将 大 个 数组 中 的 第 一 个 元 素 存 入 堆 中 ; 
(3) 重复 nk 步 : 
。 提取 堆 的 根 结 点 作为 输出 
。 将 根 结 点 对 应 序列 的 下 一 个 元 素 插入 堆 的 根 位 置 。 如 果 没 有 该 结 点 对 应 序列 
的 元 素 , 就 将 无 穷 大 插入 到 堆 的 根 位置 
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代码 5.18 合并 大 个 有 序 序列 





from collections import namedtuple 
import heapq 


def mergeKSortedArrays(alist): 
h = list()  # 最 小 堆 
res= list() # 合并 后 的 输出 
heapContent = namedtuple('contents', ('elem', 'array_idx', 'array_elem idx')) 
# 每 一 个 序列 k 的 第 一 个 元 素 按照 堆 结 构 组 织 
for i, k in enumerate(alist): 
heapq.heappush(h, heapContent (k[0] ,i,1)) 
total_elems = len(alist)* len(alist[0]) 
for - in range(0, total elems): 
popped = heapq.heappop(h) 
if popped.elem == float("inf"): 
continue 
res.append(popped.elem)  # 将 堆 中 最 小 元 素 弹 出 并 加 入 到 res 中 
next_array = popped.array_idx 
next_elem_ idx = popped.array_elem idx 
if next_elem idx < len(alist [next_array]): 
# 将 被 移 除 出 堆 所 属 的 序列 的 下 一 个 元 素 插入 到 当前 堆 中 
heapq.heappush(h, heapContent(alist [next_array] [next_elem_idx], \ 
next_array, next_elem idx+1)) 
else: 
# 如 果 没 有 元 素 在 当前 序列 中 ， 则 插入 一 个 最 大 整数 
heapq.heappush(h, heapContent (float("inf"),next_array, float("inf"))) 
return res 


按照 算法 流程 不 难得 到 如 代码 5.18 所 示 的 实现 。 代 码 第 7 行将 堆 结构 按照 元 素 值 、 
序列 索引 和 元 素 值 索 引进 行 组 织 ,这样 可 以 便于 从 堆 中 按照 名 称 提取 需要 的 数据 。 为 此 ， 
需要 导入 namedtuple 库 ， 见 代码 5.18 第 1 行 。 代 码 5.18 第 14 行 采 用 Hoat("inf") 得 到 
系统 最 大 值 。 堆 仍然 采用 Python 中 的 heapq， 见 代码 第 2 行 。 

下 面 我 们 来 分 析 通 过 堆 来 合并 大 个 有 序 序列 的 算法 时 间 复 杂 度 。 创建 nk 大 小 的 数 
组 执行 时 间 为 O(nk), 创建 上 个 元 素 的 堆 的 时 间 为 O(k)。 循环 共有 nk 次 , 每 一 次 循环 
于 根 结 点 元 素 被 删除 , 加 入 到 该 位 置 的 元 素 可 能 违背 堆 性 质 , 这 需要 O(log) 的 时 间 
让 该 元 素 符合 堆 性 质 。 因此 , 算法 总 的 执行 时 间 




















T(n) = O(nk) + O(k) + O(nklogk) (5.5) 





因此 , 通过 引入 堆 结 构 来 合并 个 有 序 序列 的 算法 时 间 复 杂 度 为 O(nklog 请。 


5.5 “小 结 


本 章 主要 介绍 了 通过 排序 或 者 数据 结构 来 组 织 数 据 。 我 们 也 再 次 感受 到 转化 的 力 
量 , 本 章 不 仅 把 无 序 转化 为 有 序 , 还 把 无 序 转化 为 结构 。 这 种 转化 最 根本 的 目的 就 是 为 
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了 更 快 地 检索 到 需要 的 数据 。 

排序 是 最 为 常用 的 组 织 数 据 的 方法 之 一 ,选择 排序 与 插入 排序 的 执行 时 间 均 为 
O(m?)。 插 入 排序 需要 频繁 的 移动 元 素 , 而 选择 排序 移动 的 次 数 则 要 少 很 多 。 因 此 ,如果 
在 一 个 移动 元 素 相 当 耗 时 的 设备 中 排序 (如 磁盘 ), 这 时 选择 排序 显然 要 优 于 插入 排序 。 
如 果 一 个 序列 中 , 大 部 分 数据 均 有 序 , 这 时 选择 插入 排序 则 更 为 合适 。 

相 比 较 于 插入 排序 和 选择 排序 , 合并 排序 的 执行 时 间 为 O(nlogn), 也 就 是 执行 效 
率 有 提高 。 然 而 , 合并 排序 需要 额外 的 空间 用 于 存储 合并 的 结果 ,因此 它 不 是 原 位 排序 
算法 。 而 选择 排序 和 插入 排序 因为 执行 过 程 并 不 需要 额外 空间 ,因此 它们 都 是 原 位 排序 
算法 。 合并 排序 是 稳定 排序 , 也 就 是 说 如 果 输 入 序列 有 两 个 值 相同 的 元 素 , 合并 排序 能 
保证 其 排序 的 结果 是 先 出 现 的 那个 元 素 在 后 出 现 元 素 的 前 面 。 

从 本 章 的 排序 与 数据 操作 的 实现 中 , 我 们 再 一 次 体验 到 递归 的 强大 。 但 需要 强调 的 
是 , 尽管 在 介绍 排序 算法 的 实现 时 大 多 采用 递归 , 这 只 是 为 了 让 读者 进一步 熟悉 递归 的 
应 用 而 采用 的 一 种 实现 方式 。 在 实际 排序 算法 的 实现 中 , 还 是 大 多 采用 循环 实现 。 这 是 
因为 递归 的 实现 会 导致 函数 频繁 的 进出 运行 栈 , 从 而 降低 算法 效率 。 此 外 , 本 章 也 没有 
再 对 其 他 排序 算法 进行 介绍 ， 比 如 时 间 复 杂 度 是 线性 时 间 的 基数 排序 、 计 数 排序 等 。 

二 又 搜索 树 是 常用 的 组 织 数据 的 结构 ， 它 可 以 看 作 是 一 系列 结 点 的 集合 ， 各 个 结 点 
通过 引用 形成 连接 关系 。 在 二 又 搜索 树 中 搜索 某 个 元 素 是 否 存在 ， 其 执行 时 间 就 是 树 的 
高 度 。 需 要 特别 说 明 的 是 ,二 又 搜索 树 如 果 输 入 数据 是 有 序 的 , 那么 得 到 的 是 一 棵 不 平 
衡 的 二 又 树 ， 此 时 在 树 上 搜索 的 时 间 复 杂 度 就 是 O(n)。 因 此 , 为 了 提高 搜索 效率 , 往往 
会 在 构造 二 又 搜索 树 时 ， 尽 量 保证 其 具有 平衡 性 。 平衡 意味 着 结 点 左右 子 树 的 高 度 大 臻 
相等 ,，AVL 树 和 红 黑 树 都 是 典型 的 平衡 二 又 树 。 

堆 是 一 棵 完全 二 又 树 , 它 将 序列 中 值 最 小 (最大) 的 元 素 置 于 树 的 根部 。 因此 ， 如果 
某 个 问题 需要 频繁 操作 序列 的 最 大 或 最 小 元 素 , 这 时 就 应 该 考虑 使 用 堆 来 组 织 该 序列 。 
对 nn 个 数据 按照 堆 结 构 进行 组 织 的 时 间 复杂 度 为 O(n), 因此 构造 堆 结构 的 算法 尽管 看 
上 去 复杂 , 但 其 实 还 是 比较 高 效 的 。 








课 后 习题 


习题 5-1 ”排序 算法 流程 
给 定 一 组 序列 A=[11, 6, 8, 19, 4, 10, 5, 17, 43, 49, 31]: 
(a) 按照 插入 排序 算法 , 请 画 出 序列 A 的 排序 过 程 。 
(b) 按照 选择 排序 算法 , 请 画 出 序列 A 的 排序 过 程 。 
(c) 按照 合并 排序 算法 , 请 画 出 序列 A 的 排序 过 程 。 


习题 5-2 ”排序 算法 应 用 


(a) 插入 排序 的 时 间 复 杂 度 为 O(n?), 而 合并 排序 的 时 间 复 杂 度 为 O(nlogn)。 为 什 
么 人 们 在 抓 扑 克 的 时 候 不 采用 更 高 效 的 合并 排序 , 而 是 插入 排序 ? 
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(b) 什么 是 稳定 排序 ? 插入 排序 、 选 择 排序 和 合并 排序 哪个 属于 稳定 排序 ? 

(c) 什么 是 原 位 排序 ? 插入 排序 、 选 择 排序 和 合并 排序 哪个 属于 原 位 排序 ? 

(d) 如 果 待 排序 的 序列 中 有 50% 的 元 素 是 相同 的 , 这 时 你 会 选择 插入 排序 、 选 择 排 
序 和 合并 排序 中 的 哪个 排序 算法 , 为 什么 ? 
习题 5-3 ”二 又 搜索 树 

(a) 有 字符 序列 为 ['E', WA 9 a 1 Wy EE', 起 wt 由， IN1， 请 画 出 依次 
插入 序列 元 素 到 BST 的 过 程 , 字符 大 小 按照 字母 表 先 后 顺序 。 

(b) 按照 后 序 遍 历 , 将 以 上 BST 各 个 结 点 的 遍历 结果 写 出 。 

(c) 实现 删除 BST 上 一 个 结 点 的 算法 。 

(d) 实现 查找 BST 最 小 值 结 点 的 算法 。 
习题 5-4 ” 堆 结 构 

(a) 写 出 一 个 程序 isComplete 判断 一 棵 二 又 树 是 否 为 完全 二 又 树 。 

(b) 写 出 一 个 程序 hasValueProperty 判断 一 棵 二 叉 树 是 否 满足 堆 性 质 , 即 每 一 个 结 
点 均 大 于 其 子 结 点 的 值 。 

(ce) 画 出 输入 序列 为 [80, 40, 30, 60, 81, 90, 100, 10] 的 建 堆 过 程 。 
习题 5-5 “寻找 最 小 的 元 素 

一 个 及 个 整数 的 数组 ,其 中 的 值 非常 大 。 

(a) 设计 复杂 度 为 O(N log N) 算法 , 找 出 其 中 最 小 的 天 个 元 素 , 其 中 大 远 远 小 于 N。 

(b) 给 出 一 个 复杂 度 为 O(NE) 的 算法 , 找 出 其 中 最 小 的 上 个 元 素 。 

(c) 如 何 利用 堆 结构 , 来 实现 找 出 其 中 最 小 的 大 个 元 素 ? 
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本 章 学 习 目 标 
。 掌握 分 治 算法 求解 问题 的 三 个 基本 步骤 
。 熟悉 利用 分 治 算法 求解 典型 计算 的 问题 
。 熟练 掌握 分 治 算法 的 时 间 复 杂 度 分 析 

















6.1 引言 


分 治 算法 (Divide and Conquer, D&C) 是 一 类 常见 的 解决 问题 的 办 法 , 其 基本 思想 
是 将 复杂 的 问题 分 解 成 几 个 简单 的 子 问 题 ， 然 后 递归 求解 各 个 子 问 题 ， 从 而 寻求 原 问题 
解 的 算法 。 利 用 分 治 算法 求解 问题 一 般 包 括 三 个 主要 步骤 ; 

。 第 一 , 将 问题 分 解 成 若干 简单 的 子 问 题 

。 第 二 , 通过 递归 寻求 各 个 子 问题 的 解 

。 第 三 , 合并 各 个 子 问 题 的 解 ， 从 而 得 到 原 问题 的 解 

分 治 不 仅 是 一 类 常用 的 计算 机 算法 , 在 日 常生 活 中 也 会 常常 用 它 去 解决 具体 的 问 
题 。 孙子 兵 法 就 曾 有 “ 倍 则 分 之 ”的 战略 , 其 意思 就 是 把 强大 的 敌人 进行 分 割 , 寻求 在 局 
部 能 获得 的 优势 兵力 的 战 法 , 这 与 分 治 算法 有 异曲同工 之 妙 。 分 治 算法 中 分 解 问题 的 思 
想 在 本 书 的 许多 章节 中 都 有 体现 。 比 如 第 4 章 的 递归 算法 、 第 8 章 的 贪心 算法 和 第 9 章 
的 动态 规划 算法 ,都 是 将 原 问 题 分 解 成 几 个 子 问题 并 用 递归 来 求解 子 问题 。 

分 治 算法 在 分 解 问题 时 ， 一 般 都 是 将 原 问题 按照 其 输入 规模 划分 成 若干 个 小 规模 的 
子 问题 。 如 果 问 题 的 输入 是 一 个 序列 , 则 一 般 将 问题 一 分 为 二 从 而 得 到 两 个 子 问 题 。 在 
合并 子 问 题 的 解 时 , 往往 需要 考虑 解 可 能 存在 跨 界 的 情况 , 即 解 并 非 完 整 的 存在 于 某 个 
子 问题 内 。 因 此 , 合理 地 合并 子 问题 的 解 常 常 是 设计 分 治 算法 的 难点 所 在 。 

采用 分 治 法 求解 的 问题 , 其 算法 复杂 度 的 分 析 有 相似 的 求解 过 程 。 不 妨 设 问 题 A 共 
有 a 个 子 问题 ， 每 一 个 子 问题 的 规模 为 n/b。 其 中 , a > 0, 也 就 是 说 子 问 题 可 以 是 0 个 
或 者 1 个 或 者 2 个 等 等 , a 具体 取 多 少 与 给 定 的 问题 有 关 。 另 外 , b > 0, 也 就 意味 着 每 
一 个 子 问 题 的 规模 总 是 小 于 原 问题 。 比 如 当 》 = 2 时 , 则 意味 着 子 问题 的 规模 是 原 问 题 
的 一 半 。n 为 问题 A 输入 数据 的 规模 。 
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设 问 题 A 的 算法 执行 时 间 为 了 (n)， 那么 T(n) 就 应 该 等 于 a 个 子 问题 各 自 执行 
的 时 间 , 再 加 上 合并 子 问题 解 的 时 间 。 由 于 子 问题 采用 递归 的 方式 求解 ,因此 各 个 
子 问 题 的 执行 时 间 就 可 以 写成 aT(n/b)。 合并 子 问 题 的 时 间 与 具体 的 问题 有 关 ， 记 
为 time[merge( )]，merge( ) 为 合并 各 个 子 问题 的 函数 。 由 此 可 得 分 治 算法 执行 的 时 
间 为 : 





T(n) = aT(n/b) + timelmerge( )] (6.1) 


本 章 将 通过 股票 买卖 、 统 计 逆序 和 求 空间 最 小 距离 点 对 等 问题 , 来 展示 分 治 算法 的 
三 个 主要 步骤 在 求解 具体 问题 中 的 应 用 。 


6.2 ”股票 的 买卖 


6.2.1 ”问题 描述 


2015 年 上 半年 , 中 国 股市 行情 就 像 过 山 车 一 样 , 大 起 大 落 。 股 民 们 则 希望 在 这 波 云 
诡 育 的 市 场 中 能 获得 最 大 的 收益 。 理想 状 况 下 ,如 果 能 实现 交易 的 低 买 高 卖 , 就 能 在 股 
市 中 挣 得 倪 满 钵 胡 。 本 章 的 第 一 个 问题 便 是 给 定 一 组 股票 价格 的 数据 , 需要 确定 何 时 买 
进 , 何 时 卖 出 能 获得 最 大 收益 。 比 如 一 支 股 票 , 其 在 5 天 内 的 价格 分 别 为 prices = [10， 
11, 7, 10, 6]。 如 果 在 第 1 天 价格 为 10 的 时 候 买 进 , 在 第 2 天 价格 为 11 时 卖 出 , 收益 即 
为 1。 在 第 3 天 价格 为 7 的 时 候 买 进 , 第 4 天 价格 为 10 的 时 候 卖 出 , 这 样 便 能 获得 最 佳 
的 收益 为 3。 
由 于 买 必须 发 生 在 卖 的 前 面 , 因此 问题 似乎 存在 一 个 直观 算法 。 即 首先 找到 这 组 股 
票 价格 的 最 低 值 和 最 高 值 , 然后 从 最 低 值 出 发 向 右 在 其 右边 序列 中 找到 一 个 最 大 值 ; 此 
外 ,从 最 高 值 出 发 向 左 在 其 左边 序列 中 找到 一 个 最 小 值 。 比 较 这 两 种 情况 下 得 到 的 收益 
值 , 选择 收益 大 的 作为 买 进 和 卖 出 的 时 间 点 。 然 而, 这 种 算法 并 不 能 总 是 确保 获得 最 佳 
收益 。 比 如 ,对 于 prices = [10, 11, 7, 10, 6], 获得 最 佳 收 益 的 买 进 价格 7 和 卖 出 价格 10 
都 不 是 5 天 内 价格 的 最 大 值 或 最 小 值 。 这 说 明 按 照 以 上 算法 进行 交易 ， 并 不 能 确保 获得 
最 佳 收 益 。 




















6.2.2 ”算法 设计 

既然 不 能 选择 股票 价格 的 最 大 或 者 最 小 值 来 确定 交易 点 , 那么 为 何不 直接 算出 所 有 
可 能 进行 交易 的 组 合 , 求 出 其 中 收益 最 大 的 便 能 确定 最 佳 交 易 点 。 也 就 是 说 , 对 于 输入 
序列 两 两 求 出 它们 之 间 的 差 值 , 并 且 只 记录 当前 的 最 优 收益 值 。 这 种 方法 其 实 就 是 穷 举 
问题 所 有 的 可 行 解 , 然后 从 中 选择 一 个 最 优 的 解 。 算 法 的 实现 见 代 码 6.1。 代码 6.1 包括 
一 个 二 重 循环 , 经 由 变量 best 来 记录 最 佳 受益 , 不 难得 到 其 时 间 复 杂 度 为 O(n?)。 
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代码 6.1 求解 交易 点 的 简单 算法 





def max_profit_simple(prices) : 
best = 0 # 记录 当前 的 最 优 值 
ind_best = [] # 记录 买 进 和 卖 出 的 时 间 点 
len prices = len(prices) 
for i in range(len prices): 
for j in range(li+1, len_prices): 
if prices[j]-prices[i]>best: 
best = prices[j] - prices[i] 
ind best = [i, j] 


return ind_best,best 


除了 以 上 时 间 复 杂 度 为 O(n?) 的 简单 算法 , 还 可 以 通过 分 治 算法 来 求解 该 问题 。 
对 于 价格 序列 prices, 假设 存在 函数 max_profit_dc(prices) 可 以 求 得 最 佳 买 卖点 。 那 
么 ， 不 妨 将 输入 序列 分 解 成 两 个 部 分 prices_left 和 prices_right。 显 然 求解 这 两 个 部 
分 的 策略 与 原 问 题 的 策略 相同 ,都 是 函数 max_profit_dc( )。 不 同 之 处 就 是 ,求解 子 问 
题 函数 的 输入 分 别 是 prices_left 和 prices_right。 也 就 是 ， 子 问题 求解 的 函数 形式 为 
max_ profit_dc(prices_left) 和 max_profit_dc(prices_right)。 前 一 函数 可 以 得 到 输入 序列 
左边 部 分 的 最 佳 买卖 点 , 后 一 函数 则 可 以 得 到 输入 序列 右边 部 分 的 最 佳 买卖 点 。 

在 求解 出 子 问题 的 解 后 , 需要 考虑 max_profit_dc(prices) 的 解 是 否 等 于 max_profit_ 
dc(prices_left) 与 max_profit_dc(prices_right) 解 的 简单 合并 。 显 然 , 最 佳 买 卖点 并 不 一 
定 在 prices_left 或 prices_right 内 , 而 是 有 可 能 买点 在 prices_left, 而 卖点 在 Prices_right 。 
也 就 是 说 ,可 能 的 解 一 部 分 在 左边 子 序列 ， 另 一 部 分 在 右边 子 序列 ， 即 最 优 买卖 点 可 能 
跨 界 。 


Min 








Max 


图 6.1 求解 跨 界 情况 下 的 最 优 买卖 点 


如 何 得 到 跨 界 情况 下 的 最 优 解 呢 ? 只 需要 找到 左边 序列 的 最 小 值 , 再 找到 右边 序列 
的 最 大 值 , 它们 之 间 的 差 值 就 是 跨 界 情况 下 的 最 优 买 卖点 , 如 图 6.1 所 示 。 这 样 , 最 佳 买 
卖点 要 么 在 序列 左边 、 要 么 在 序列 右边 或 者 跨 界 。 最 终 的 解 就 是 这 三 个 可 行 解 的 最 大 值 ， 
利用 分 治 算法 求解 的 实现 见 代码 6.2。 
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代码 6.2 买 入 卖 出 问题 的 分 治 算法 





def max_profit_dc(prices) : 
len prices = len(prices) 
if len prices <= 1: # 边界 条 件 
return 0 
mid = len_prices//2 
Prices_left = prices[:mid] 
Prices_right = prices [mid:] 
maxProfit_left = max_profit_dc(prices_left) # 递归 求解 左边 序列 
maxProfit_right = max_profit_dc(prices_right)  # 递归 求解 右边 序列 
maxprofit_left_right = max(prices_right)-min(prices_left) # 可 能 跨 界 
return max(maxProfit_left, maxProfit_right, maxprofit_left_right) 


下 面 将 求解 代码 6.2 的 执行 时 间 T(n)。 代 码 第 8 行 与 第 9 行为 递归 求解 规模 为 

n/2 的 子 问题 ， 其 执行 时 间 均 应 为 了 (nz/2)。 第 10 行 处 理 跨 界 情况 ,在 prices_right 和 
prices_left 中 找 最 大 值 和 最 小 值 的 时 间 为 O(n)。 因 此 , 代码 6.2 的 时 间 复 杂 度 为 : 

T(n) =27(n/2) + O(n) (6.2) 


根据 Master Method 求解 该 递归 式 可 得 T(n) = O(nlogn)。 因 此 , 通过 分 治 算法 得 
到 了 一 个 相 比较 于 简单 算法 更 为 高 效 的 算法 。 

以 上 问题 还 可 以 通过 记录 每 一 个 数 左 部 的 最 小 值 来 进行 求解 。 首 先 ， 从 左 到 右 依次 
扫描 序列 元 素 , 并 求 得 该 元 素 左 部 最 小 值 。 如 图 6.2 所 示 , 第 一 个 元 素 13 由 于 左边 部 分 
没有 其 他 元 素 , 因此 其 左 部 最 小 就 是 13。 当 前 的 最 小 值 13 比 序列 的 第 二 个 元 素 17 小 ， 
因此 对 17 来 说 , 其 左 部 最 小 的 依然 是 13。 直 到 扫描 到 第 4 个 元 素 时 , 最 小 值 才 从 13 变 
成 8。 按照 这 个 计算 过 程 , 可 以 求 出 每 个 元 素 其 左 部 序列 的 最 小 值 。 然后 , 将 输入 序列 与 
左 部 最 小 序列 对 应 相 减 , 得 到 的 差 值 序列 中 的 最 大 值 就 是 问题 的 解 。 


sree TaeToTr eT] wm 
13 区 [53] 8 | 8 | 8 | 8 | 7 | 7 | 7 | 左 部 最 小 值 


"|[4|>|o1s[7 大 "| | >] ¥e 


图 6.2 ”线性 时 间 算法 示意 图 























以 上 算法 第 一 次 扫描 序列 得 到 各 个 元 素 最 小 值 的 时 间 复 杂 度 为 O(n), 求 得 差 值 序 
列 并 从 中 求 最 大 值 的 时 间 复 杂 度 都 是 O(n)。 因 此 , 算法 总 的 时 间 复 杂 度 就 是 O(n) @. 

需要 说 明 的 是 , 我 们 还 可 以 将 以 上 问题 做 一 个 简单 的 变换 。 原 问题 考虑 的 是 买 入 和 
卖 出 点 ， 和 中 间 价 格 的 变动 并 没有 直接 的 关系 。 可 以 将 问题 转换 为 连续 序列 的 累加 和 最 








@ 该 算法 由 浙江 工业 大 学 2015 届 学 生 严 凡 提出 。 
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大 问题 ,为 此 , 可 以 考虑 将 原来 每 日 股票 的 价格 变 成 前 后 两 天 的 收益 , 如 股票 价格 为 [10， 
11, 7, 10, 6], 那么 前 后 两 日 的 收益 为 [1, 一 4, 3, 一 人。 经 过 这 个 转换 , 就 可 以 将 原来 的 确定 
买 入 和 卖 出 点 问题 , 变换 成 给 定 一 个 序列 , 找 出 其 中 连续 累加 值 最 大 的 子 序列 。 这 个 问 
题 同样 可 以 采用 O(nlogn) 的 分 治 算法 来 求解 ， 也 可 以 用 时 间 复 杂 度 为 O(n) 的 动态 规 
划算 法 求解 ( 见 9.3.2 节 ) 。 


6.3 ”统计 逆序 




















6.3.1 ”问题 描述 


豆 办 有 是 一 家 图 书 、 电 影 和 音乐 唱片 的 评价 与 推荐 网 站 。 这 类 推荐 类 网 站 会 根据 你 对 
一 系列 书籍 的 评价 ， 从 它 的 读者 数据 库 中 找 出 与 你 的 评价 非常 类 似 的 读者 推荐 给 你 ， 从 
而 帮助 你 找到 品味 相近 的 朋友 。 假设 你 对 五 本 书 进行 了 评价 , 这 五 本 书 你 的 打分 从 低 到 
高 依次 是 [1, 2, 3, 4, 5]。 另 外, 读者 A 的 对 这 五 本 书 的 打分 是 [2, 4, 1, 3, 5], 而 读者 也 的 
打分 是 [3, 4, 1, 5, 2]。 那么, 应 该 把 读者 A 还 是 读者 B 推荐 给 你 呢 ? 

豆瓣 也 许 会 把 读者 A 推荐 给 你 , 因为 相 比 较 于 读者 B, 读者 A 与 你 的 口味 更 为 相 
投 。 那 怎么 来 量化 推荐 的 准则 呢 ? 这 可 以 通过 计算 一 个 称 为 逆序 量 的 来 度量 相似 度 。 对 
于 输入 序列 ， 如 果 元 素 的 索引 i < j，, 且 ui > oj， 那么 元 素 a; 和 a; 是 一 对 逆序 。 打 分 
[1, 2, 3, 4, 5] 的 逆序 对 数 为 0, 读者 A 打分 [2, 4, 1, 3, 5] 存在 3 对 逆序 , 分 别 是 [2, 1]， 
[4, H] 和 [4, 3]。 读者 B 打分 [3, 4, 1, 5, 2] 的 逆序 数 为 5 对 , 分别 是 [3, 1], [3, 2], [4, 1]， 
[4, 2 和 [5, 2]。 因 此 ， 如果 用 逆序 数 来 度量 推荐 准则 , 那么 读者 A 相 比 较 于 读者 B 与 你 
有 更 为 接近 的 品位 。 本 节 的 问题 就 是 计算 给 定 序列 的 逆序 数 。 


6.3.2 ”算法 设计 
一 个 简单 直接 的 算法 就 是 对 于 每 一 个 元 素 ,计算 该 元 素 右边 有 几 个 元 素 比 它 小 。 例 


如 ,对 于 输入 序列 [2, 4, 1, 3, 5], 元 素 2 的 右边 共有 1 个 元 素 [1] 比 它 小 , 元 素 4 的 右边 
共有 2 个 元 素 [1, 3] 比 它 小 。 因此, 以 上 序列 共有 3 对 逆序 。 


代码 6.3 逆序 计算 的 简单 算法 





def count_inversions_simple(A) : 
inv_count = 0 
inv_ list = [] 
lenA = len(A) 


for i in range(lenA): # 索引 A 中 各 个 元 素 
for j in range(i, lenA): # 得 到 A 中 某 个 元 素 所 有 右边 的 元 素 
if A[i > Arj] : # 判断 是 否 存在 逆序 


inv_count += 1 
inv_ list.append([A[i] ,A[j]]) 


return inv_count, inv_list 
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根据 以 上 分 析 , 不 难得 到 如 代码 6.3 所 示 的 实现 。 以 上 实现 是 一 个 二 重 循环 , 外 循环 
用 于 索引 输入 序列 A 的 各 个 元 素 ， 内 循环 则 索引 当前 元 素 i 之 后 的 各 个 元 素 , 用 于 找 出 
Ai] 与 之 后 各 个 元 素 的 逆序 对 。 以 上 算法 共有 n 次 循环 , 每 一 次 循环 的 执行 次 数 分 别 为 
n 一 1 十 n 一 2 十 … 十 1, 因此 其 时 间 复 杂 度 为 O(n?)。 

下 面 考 虑 采用 分 治 算法 来 求解 逆序 对 问题 。 按 照 分 治 算法 求解 问题 的 步骤 , 首先 考 
虑 分 解 原 问题 为 几 个 子 问 题 。 对 于 输入 序列 A, 假设 函数 count_inversions_dc(A) 可 以 
求 得 问题 的 解 〈 见 代码 6.4)。 将 输入 序列 A 分 为 两 部 分 , AL 和 AR。 其 次 , 由 于 A 与 子 
问题 AL 和 AR 只 有 规模 上 的 不 同 , 因此 AL 和 AR 可 以 使 用 完全 相同 的 策略 用 于 计算 
AL 和 AR 中 的 逆序 数 , 也 就 是 count_inversions_dc(AL), count_inversions_dc(AR)。 最 
后 ， 原 问题 的 解 也 有 可 能 分 别 落 在 AL 与 AR 中 , 也 就 是 需要 考虑 解 存在 跨 界 的 可 能 。 
因此 , 总 的 逆序 数 应 该 等 于 左边 子 问 题 AL 求 得 的 逆序 数 加 上 右边 子 问题 AR 求 得 的 逆 
序数 ， 再 加 上 跨 界 情况 下 求 得 的 逆序 数 。 


























代码 6.4 逆序 计算 的 分 治 算法 


def count_inversions_dc(A) : 
lenA = len(A) 
if lenA <= 1: # 边界 条 件 
return 0, A 
middle = lenA // 2 
leftA = A[:middle] 
rightA = A[middle:] 
countLA, leftA = count_inversions_dc(leftA) # 说 归 分 解 
countRA, rightA = count_inversions_dc(rightA) # 递归 分 解 
countLRA, mergedA = merge_and_count (leftA，rightA) # 合并 并 计算 逆序 数 


return countLA+countRA+CouUntLRA ，mergedA 


如 何 求解 解 跨 界 情况 下 的 逆序 对 数 呢 ? 如 果 在 每 次 合并 时 , 都 需 将 AL 中 元 素 与 AR 
中 所 有 元 素 进行 比较 。 那 么 由 于 AL 中 有 n/2 个 元 素 , 而 AR 中 元 素 个 数 也 是 ny2 个 元 
素 , 这 样 导 致 计算 跨 界 情况 下 解 的 时 间 复 杂 度 就 是 O(n?)。 那 么 使 用 分 治 算法 求解 逆序 
问题 的 时 间 复 杂 度 就 变 成 了 : 

















T(n) = 2T(n/2) 十 OU) (6.3) 


根据 Master 方法 求解 以 上 递归 式 可 得 T(n) = O(n?)。 也 就 是 说 , 相 比 较 于 之 前 的 
简单 算法 , 采用 分 治 算法 并 没有 提高 算法 效率 。 这 主要 是 因为 在 合并 子 问 题解 的 时 候 ， 
其 时 间 复 杂 度 是 O(n?)。 

为 了 提高 采用 分 治 法 求解 问题 的 效率 , 应 该 考虑 优化 求解 跨 界 情况 下 问题 的 解 。 求 
办 跨 界 问题 时 ， 如果 AL 和 AR 均 有 序 , 那么 就 不 需要 将 AL 中 的 每 一 个 元 素 与 AR 中 
所 有 元 素 进行 比较 。 比 如 ，AL 中 元 素 AL[i] 大 于 AR 中 的 某 个 元 素 AR[j]， 那么 此 时 
ARIj] 之 后 的 所 有 元 素 AR[j 十 1],AR[j + 3],…,AR[end| 与 AL 都 构成 逆序 对 , 这 是 因 
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为 AL 序列 整体 在 AR 序列 的 左边 。 这 样 就 不 需要 将 AL[i] 与 ARD] 之 后 的 元 素 依 次 进 
行 比较 。 

AL 和 AR 有 序 的 情况 下 , 的 确 是 可 以 提高 求解 跨 界 情况 下 解 的 效率 。 然 而 ,如果 
先 对 AL 和 AR 排序, 那么 就 破坏 了 AL 和 AR 中 数 的 位 置 关 系 ， 从 而 得 不 到 其 中 准 
确 的 逆序 数 。 因 此 , 子 问题 有 序 和 求 逆 序数 就 好 比 一 个 是 鱼 , 一 个 是 能 掌 ， 如 何 能 
得 呢 ? 

解决 以 上 问题 的 办 法 是 在 计算 逆序 对 的 过 程 中 同时 完成 排序 , 也 就 是 边 排序 边 计算 
逆序 对 数 。 当 两 个 子 问 题 的 逆序 数 计算 出 来 后 ,也 同时 完成 了 对 它们 的 排序 。 这 意味 着 
当 两 个 子 问题 的 输入 序列 排序 完成 ,那么 这 两 个 子 问 题 的 解 以 及 它们 之 间 跨 界 的 解 也 求 
出 来 了 。 因此, 与 合并 排序 ( 见 5.2.3 节 ) 的 过 程 类 似 , 需要 比较 AL 中 元 素 u 与 AR 中 
元 素 b; 之 间 的 大 小 : 

。 如 果 a; < b;, 那么 ai 与 AR 中 剩余 元 素 均 构 成 逆序 

。 如 果 ai > bj, 那么 b; 与 AL 中 剩余 元 素 不 构成 逆序 

计算 过 程 可 见 图 6.3, 其 中 AL=[2, 四 , AR=[1, 3, 四 。 首 先 比较 AL 中 的 第 一 个 元 素 
2 与 AR 中 第 一 个 元 素 大 小 , 由 于 2 大 于 1, 就 从 AR 中 将 1 移出 到 新 的 序列 中 。 再 比较 
元 素 2 与 AR 中 元 素 3, 显然 2 小 于 3, 那么 [2, 3] 与 [2, 5] 都 是 逆序 对 ， 此 时 逆序 对 数 
inv_count=2。 依 此 计算 过 程 , 最 后 得 到 inv_count=3。 由 于 AL 与 AR 之 间 跨 界 逆 序数 
已 经 计算 出 来 , 因此 将 AL 与 AR 合并 成 有 序 序列 不 会 改变 原 序列 逆序 对 数 。 


ED inw = 2 证 同 ny tonne 2 


(b) 


证 铅 古 硬 硬 i un 2 机 名 可 iv = 3 


(©) (qd) 





图 6.3 合并 计算 的 过 程 


按照 分 治 算法 ， 边 合并 排序 边 计 算 逆 序数 的 实现 见 代 码 6.5。 代 码 6.5 的 函数 
merge_and_count( ) 的 实现 与 合并 排序 的 merge 函数 ( 见 5.6) 非常 相似 , 只 是 额外 增 
加 了 计算 inv_count 的 值 。 代码 6.5 的 实现 并 没有 将 逆序 对 返回 ， 而 只 是 返回 了 逆序 
对 数 。 读 者 可 以 考虑 修改 代码 6.5 的 实现 ， 以 便 除 了 返回 逆序 对 数 外 还 能 得 到 各 个 逆 
序 对 。 
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代码 6.5 合并 计数 





def merge_and_count(A，B) : 
i, j, inv_count =0, 0, 0 
alist = [] 
lenA = len(A);lenB = len(B) 
while i<lenA and j<lenB: 
if A[i]<B[j]: 
alist.append(A[i]) 
i+=1 
else: # b[j] 与 A 当前 所 有 左边 元 素 构成 逆序 
inv_count += lenA-i 
alist.append(B[j]) 
d=t 
while i<lenA: # 处 理 A 中 剩余 元 素 
alist.append(A[i]) 
i+=1 
while j<lenB: # 处 理 B 中 剩余 元 素 
alist.append(B[j]) 
j+=1 


return inv_count, alist 


代码 6.5 的 函数 merge_and_count( ) 有 三 个 循环 , 它们 各 自 的 执行 时 间 均 为 O(n)。 
因此 , 按照 代码 6.4 实现 的 逆序 对 算法 执行 时 间 为 : 


T(n) =2T(n/2) + O(n) = O(nlogn) (6.4) 


这 意味 着 通过 优化 合并 部 分 计算 的 性 能 , 采用 分 治 算法 求解 逆序 对 问题 的 时 间 复杂 
度 为 O(nlogn)。 


6.4 空间 最 小 距离 点 对 


6.4.1 ”问题 描述 


图 片 在 计算 机 中 是 以 像素 点 矩阵 的 方式 存储 ， 比 如 对 于 一 个 大 小 为 28 x 28 的 图 片 
来 说 , 共有 784 个 像素 点 。 如 果 图 片 是 灰 度 图 , 那么 每 一 个 像素 点 取 值 在 0 到 255 之 间 。 
假设 班 上 共有 30 位 同学 , 在 选 定 课 后 为 每 一 个 同学 拍 一 幅 28 x 28 大 小 的 头像 , 将 这 30 
个 人 的 头像 图 片 存在 计算 机 内 。 在 期 末 考 试 时 ,监考 老师 需要 设计 一 个 算法 来 自动 确定 
某 个 同学 是 不 是 班 上 的 学 生 。 这 个 算法 可 以 这 样 设计 : 

。 为 这 位 同学 拍 一 张大 小 为 28 x 28 的 头像 I 

。 将 这 位 同学 的 头像 与 班 上 已 有 的 30 位 同学 的 头像 依 此 进行 比较 

。 找 出 与 这 位 同学 头像 最 为 接近 的 一 个 头像 M 
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。 如 果 工 与 M 的 差 值 在 一 定 范围 , 就 认定 工 就 是 M; 否则 认为 工 不 是 班 上 的 学 生 
显然 , 以 上 算法 的 关键 就 是 将 这 位 同学 的 头像 与 班 上 30 位 同学 的 头像 依次 进行 比 
较 。 由 于 每 一 幅 图 像 有 784 个 数据 , 那么 一 幅 头 像 就 可 以 看 作 是 784 维 空间 中 的 一 个 点 。 





头像 的 比较 问题 就 转化 为 给 定 空间 的 nn 个 点 , 找 出 这 些 点 中 欧 氏 距离 最 小 的 一 对 点 。 如 
图 6.4 所 示 , 图 中 两 个 有 连 线 的 点 即 为 距离 最 近 的 两 个 点 。 
® 
。 . 
. e 一 后 


图 6.4 空间 距离 最 近 的 点 


6.4.2 ”算法 设计 

为 了 便于 描述 , 假设 空间 是 二 维 平 面 , 点 的 集合 P= {pi,p2,… ,pn}。 每 一 个 点 由 二 
维 坐标 确定 其 位 置 , 也 就 是 pi = [zu gog， …, pn = [znyyn]j。 其 中 ,zi 和 i 分 别 为 点 pi 
的 横 坐 标 与 纵 坐标 值 ，zn 和 y 分 别 为 点 pn 的 横 坐 标 与 纵 坐标 的 值 。 那么 , 两 点 之 间 的 
欧 氏 距离 就 是 : 

din = V (zn — £1)? + (yn — Y1)? (6.5) 

为 了 求 得 最 近 距 离 点 对 , 一 个 直接 的 算法 就 是 对 于 每 一 个 点 都 计算 它 与 其 余 点 之 
间 的 距离 。 然 后 找 出 其 中 距离 值 最 小 所 对 应 的 点 对 , 就 能 得 到 问题 的 解 。 这 个 算法 的 实 
现 见 代 码 6.6， 该 算法 的 计算 过 程 相当 于 从 m 个 点 中 选 出 两 个 点 进行 组 合 ， 其 计算 次 数 
为 (3)。 因 此 , 代码 6.6 的 时 间 复 杂 度 为 O(n?)。 


代码 6.6 计算 最 近 距 离 的 直接 算法 





import math 
def closestpair_simple(X, n): 
min d = distance(X[0], X[1]) # 记录 当前 最 小 距离 
for i,(x,y) in enumerate(X): 
for j in range(i+1, n): 
if distance(X[i], X[j]) < min_d: 
min p = [X[i], X[j]] # 记录 哪 两 个 点 
min d = distance(X[i], X[j]) 
return min p, min_d 
def distance(a,b): # 计算 两 点 之 间 的 欧 拉 距 离 


return math.sqrt( math.pow( (a[0]-b[0]), 2) + math.pow((a[1]-b[1]), 2) ) 
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代码 6.6 的 实现 包括 一 个 二 重 循环 , 第 4 行 的 外 循环 索引 每 一 个 输入 的 点 , 第 5 行 
的 内 循环 索引 当前 结 点 之 后 的 各 个 结 点 。 函数 closestpair_simple( ) 的 第 一 个 参数 X 为 
点 集 , 第 二 个 参数 n 为 点 的 个 数 。 计算 两 点 之 间 欧 氏 距 离 由 函数 distance( ) 实现 。 

下 面 我 们 将 考虑 采用 分 治 算法 来 求解 以 上 问题 。 不 妨 设 对 于 n 个 点 , 求 得 它们 最 近 
距离 点 对 的 函数 为 closest_pair(P), 其 中 PP 为 输入 点 集 。 按 照 分 治 算法 求解 问题 的 步骤 ， 
可 以 得 到 : 

。 将 平面 上 的 n 个 点 分 为 两 个 部 分 PL 和 PR 

。 组 合 两 个 子 问题 的 解 以 及 可 能 存在 的 跨 界 的 解 ， 得 到 最 终 的 解 

以 上 是 分 治 算法 求解 问题 的 常规 步骤 。 然而 , 在 实际 应 用 中 ,以 上 三 个 步骤 还 需要 
仔细 设计 其 实现 过 程 。 首先 , 需要 考虑 如 何 将 空间 的 nn 个 点 分 成 两 部 分 。 可 以 按照 图 6.5 
所 示 的 用 垂直 方向 的 直线 工 将 输入 各 点 分 为 两 个 部 分 。 














. ~ 





图 6.5 将 空间 的 n 点 一 分 为 二 


将 问题 分 解 为 两 个 子 问 题 后 , 就 可 以 通过 递归 来 求解 这 两 个 子 问题 。 假设 它们 返回 
各 自 点 集 的 最 近 距 离 点 对 ,也 就 是 br = closest_pair(PL), 6k = closest_pair(PR)。 其 
中 , 6 表示 左边 部 分 点 集 的 最 近 距 离 , 6R 则 表示 右边 部 分 点 集 的 最 近 距 离 。 显然 , 目前 
能 得 到 的 最 近 距 离 为 5 = min(6L, 6R)。 
其 次 ,在 合并 子 问题 解 的 时 候 需 要 考虑 解 跨 界 的 情况 ， 即 解 的 一 个 点 位 于 PL, 而 
男 一 点 位 于 PR。 由 于 当前 已 经 得 到 了 左边 点 集 PL 和 右边 点 集 PR 的 最 近 点 对 距离 
为 6， 因此 可 以 选 定 距 离 分 界线 工 为 6 的 区 域内 来 考虑 跨 界 的 问题 ,如 图 6.6 所 示 。 
也 就 是 说 ， 选 定 区 域 之 外 两 点 间 的 距离 一 定 比 5 大 ,这样 就 可 以 缩小 合并 时 的 搜索 
范围 。 

那么 该 如 何 计算 选 定 区 域 点 之 间 的 距离 ? 一 种 简单 的 办 法 就 是 直接 计算 区 域内 两 两 
之 间 的 距离 。 然 而 , 落 在 这 个 区 域 之 间 的 点 有 可 能 非常 多 , 最 坏 情 况 下 各 自 会 有 n/2。 当 
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6=min(12, 21) 











图 6.6 确定 跨 界 的 区 域 大 小 


有 mn/2 个 点 需要 计算 两 两 之 间 的 距离 , 光 这 一 项 的 执行 时 间 就 是 O(z2)。 因 此 , 单单 限 
定 z 轴 方 向 还 不 足以 将 提高 合并 计算 的 效率 。 

为 此 , 还 应 该 在 y 轴 方 向 再 次 缩小 合并 计算 的 搜索 范围 。 可 以 先 将 落 在 图 6.6 中 阴 
影 区 域 的 点 按照 其 y 轴 坐 标的 值 进行 排序 , 如 图 6.7 所 示 。 对 于 点 1 来 说 , 如 果 某 点 的 y 
坐标 值 与 点 1 的 y 轴 坐 标 值 超过 6， 那么 这 个 点 与 点 1 显然 不 会 是 问题 的 解 。 此 外 , 所 
有 vy 轴 坐 标 比 该 点 大 的 其 他 点 都 不 需要 再 计算 它们 与 点 1 的 距离 。 





6=min(12, 21) 

















图 6.7 计算 跨 界 点 最 近 距 离 





对 于 落 在 区 域 中 的 每 一 个 点 ， 只 需要 按 y 轴 方 向 选择 7 个 点 进行 计算 即 可 , 超过 第 
7 个 点 不 需要 考虑 。 由 于 6 是 当前 已 知 的 点 对 之 间 最 小 距离 , 在 以 5 为 边 长 的 正方 形 区 
域内 , 最 多 只 能 有 4 个 点 落 在 这 个 正方 形 区 域内 。 这 4 个 点 分 布 在 正方 形 的 4 个 角 点 位 
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置 , 该 正方 形 区 域内 不 能 有 第 5 个 点 出 现 。 否则 , 一 旦 第 5 个 点 落 在 正方 形 区 域内 ， 就 
会 违背 56 是 当前 已 知 的 点 对 之 间 最 小 距离 这 一 假设 。 因此 , 分 界线 工 两 边 正 对 的 两 个 边 
长 为 5 的 正方 形 区 域内 最 多 有 8 个 点 。 当 确定 某 1 个 点 后 , 只 需要 按 y 轴 方 向 选择 7 个 
点 依次 与 该 点 计算 各 自 的 距离 值 。 其 他 点 与 该 点 的 距离 值 一 定 大 于 5, 因此 为 了 计算 跨 
界 部 分 的 解 并 不 需要 计算 界 内 点 两 两 之 间 的 距离 , 只 需要 计算 点 与 界 内 相近 的 其 他 7 个 
点 之 间 的 距离 就 可 以 。 

为 了 确定 分 界线 线 工 和 确定 跨 界 区 域内 的 点 , 需要 对 输入 点 按照 z 轴 和 y 轴 排 序 。 
为 了 进一步 提高 算法 效率 , 可 以 考虑 预先 对 输入 点 集 进行 排序 ( 见 代码 6.7)， 而 不 是 在 
递归 函数 里 反复 进行 排序 计算 。 由 于 输入 点 集 的 顺序 并 不 会 在 递归 函数 中 发 生变 化 , 因 
此 预先 排 好 序 以 后 , 在 需要 用 到 的 时 候 查 表 就 可 以 , 这 样 将 大 大 提高 了 算法 实现 的 效率 。 
































代码 6.7 空间 点 最 近 距 离 主 函 数 


def closest(P, n): 


X=1list(P) 
Y=1list(P) 
X.sort() # 预 处 理 ， 按 照 X 轴 进行 排序 
Y = sort_y(Y) # 预 处 理 ， 按 照 Y 轴 进行 排序 


return closest_pair(X, Y, n) 


求 空间 最 小 距离 的 主 函 数 见 代码 6.8。 其 中 , X 和 YY 分 别 为 n 个 点 的 zx 轴 与 y 轴 坐 
标 序列 , n 为 点 的 个 数 。 代 码 第 2 行为 边界 条 件 , 如 果 结 点 个 数 小 于 等 于 3 个 , 则 直接 求 
出 各 个 结 点 间 的 最 小 距离 。 代 码 第 7 行 到 第 11 行 之 间 的 循环 是 将 结 点 分 解 成 两 个 部 分 。 
第 12 行 与 第 13 行 分 别 为 递归 处 理 分 解 后 的 空间 点 。 第 16 行 开 始 的 循环 为 处 理 跨 界 情 
况 下 最 小 距离 的 计算 。 


代码 6.8 计算 空间 点 最 近 距 离 的 分 治 算法 


def closest_pair(X, Y, n): 
if n <= 3: # 边界 条 件 
return brute_force(X, n) 
mid = n/2 
Y_Left = [] 
YRight = [] 
forp in Y: 
if p in X[:mid]: 
Y_Left .append(p) # Y_left 中 为 直线 工 左 边 的 所 有 点 上 且 其 Y 轴 坐标 值 依 次 增 大 
else: 
YRight.append(p) ”#Y_right 中 为 直线 工 左边 的 所 有 点 且 其 Y 轴 坐标 值 依次 增 大 
dis_left = closest_pair(X[:mid], Y_Left, mid) # 递归 处 理 PL 
dis_right = closest_pair(X[mid:] ，Y_Right，n-mid) # 说 归 处 理 PR 
min dis = min(dis_left, dis_right) # 得 到 PL 和 PR 中 的 最 小 距离 
strip = [] 


17 
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or (X.Y) in Y: 


if abs( x - X[mid] [0] ) < min dis: # 只 有 L+/-min_dis 之 间 的 点 才 考 虑 


strip.append((x,y)) 


return min(min dis, strip_closest(strip, min_ dis)) 





处 理 边 界 内 最 近 点 对 、 计算 两 点 之 间 欧 拉 距 离 、 按 照 y 轴 坐 标 进行 排序 和 边界 条 件 


下 的 求解 函数 分 别 见 代码 6.9。 


代码 6.9 空间 最 小 距离 点 对 的 辅助 函数 





# 处 理 边 界 内 最 近 点 对 
def strip_closest(strip, d): 
min d=d 
for i,(x,y) in enumerate(strip): 


for j in range(i+1,，8):  # 只 需要 考虑 最 多 7 个 点 
if i+j < len(strip): # 预防 数组 越界 
temdis = distance(strip[i], strip[j]) 


if temdis < min_d: 
min d = temdis 
return min_d 
# 计算 两 点 之 间 的 欧 拉 距离 


def distance(a,b): 


return math.sqrt( math.pow( (a[0]-b[0]), 2) + math.pow((a[1]-b[1]), 2) ) 


# 按照 y 轴 坐标 进行 排序 


def sort_y(tuples): 


return sorted (tuples,key=lambda last : last[-1]) 


# 当 点 数 小 于 3 时 ， 直接 计 算 最 小 距离 
def brute_force(X, n): 

min d = distance(X[0] ，X[1]) 

for i,(x,y) in enumerate(X): 

for j in range(i+1, n): 


if distance(X[i], X[j]) < min_d: 
min d = distance(X[i], X[j]) 


return min_d 








按照 以 上 实现 , 跨 界 部 分 计算 的 时 间 复 杂 度 就 是 O(n)。 这 是 因为 , 尽管 计算 跨 界 部 
分 解 的 函数 strip-closest( ) 存在 双重 循环 , 但 是 其 内 循环 每 次 循环 的 次 数 只 有 常数 次 ， 


因此 整个 循环 的 次 数 为 cn，e 为 常数 。 





因此 , 按照 分 治 算法 求解 二 维 空间 点 最 近 距 离 的 





时 间 复 杂 度 为 了 (n) =2T(n/2) + O(n) = O(nlogn)。 

从 以 上 实现 不 难看 出 为 了 提高 算法 效率 , 对 算法 合并 部 分 的 计算 进行 了 优化 。 也 就 
是 说 , 将 原来 O(n?) 的 计算 减 小 到 O(n)。 这 与 统计 逆序 数 对 的 分 治 算法 优化 是 类 似 的 ， 
均 是 在 合并 子 问题 解 的 时 候 尝试 优化 ， 从 而 得 到 整体 更 为 高 效 的 算法 。 
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6.5 “寻找 第 有 小 的 数 


6.5.1 ”问题 描述 


期 末 考 试 批改 了 mn 份 试卷 , 如 何 找 出 考分 第 十 名 的 学 生 ? 如 果 学 生 的 成 绩 按照 交卷 
的 先后 依次 递减 , 那么 这 个 问题 非常 简单 , 成 绩 第 十 名 的 同学 就 是 第 十 位 交卷 的 学 生 。 
显然 , 大 家 的 成 绩 与 交卷 的 先后 没有 直接 的 关系 , 那么 该 怎么 在 如 堆 的 试卷 中 找 出 这 个 
得 分 第 十 名 的 试卷 。 按 照 上 面 的 分 析 , 也 许可 以 这 么 处 理 : 

。 将 试卷 排序 

。 从 最 高 分 的 试卷 往 下 数 从 而 定位 到 排名 第 的 那 位 同学 
1 于 需要 对 n 份 试 卷 排 序 ， 因此 以 上 算法 的 时 间 复 杂 度 是 O(n1log n)。 那 还 有 没有 
更 快 的 算法 用 来 求解 以 上 问题 呢 ? 

为 了 寻找 第 大 小 的 数 ,下面 我 们 将 介绍 由 Blum,，Floyd,，Pratt，Rivest 和 Tarjan@ 
在 1973 年 发 明 的 时 间 复 杂 度 为 O(n) 的 算法 ， 该 算法 属于 分 治 算法 。 它 与 前 面 的 分 治 算 
法 不 同 ,其 重点 不 在 于 如 何 合并 各 个 子 问题 的 解 ， 而 在 于 如 何 更 好 地 划分 子 问题 。 

首先 ， 我 们 给 出 寻找 第 大 小 数 的 问题 的 形式 化 定义 。 给 定 具 有 个 不 同 元 
素 的 序列 A， 定 义 函 数 select_fct(A, i)， 它 将 返回 序列 A 中 第 i 小 的 数 。 如 给 定 
A=[5,7, 1, -8,9,2,13], 那么 select(A, 2)= -1。 

















6.5.2 ”算法 设计 

用 分 治 算法 来 求解 问题 的 时 候 , 首先 需要 考虑 的 是 将 原 问 题 进行 分 解 。 对 于 前 面 诸 
如 合并 排序 或 者 统计 逆序 等 分 治 算法 求解 的 问题 , 只 是 简单 地 把 输入 序列 一 分 为 二 。 然 
而 ， 对 于 寻找 第 大 小数 这 一 问题 , 该 如 何 对 输入 序列 进行 分 解 呢 ? 

Blum 等 设计 了 一 个 非常 巧妙 地 划分 子 问 题 的 办 法 , 就 是 通过 找 出 一 个 被 称 为 支点 
(Pivot) 的 数 来 对 输入 序列 进行 划分 。 支 点 数 左边 的 数 都 比 支点 数 小 , 而 右边 的 数 都 比 它 
大 。 这样 做 的 目的 是 , 如 果 i 等 于 支点 数 的 索引 , 这 时 可 以 马上 返回 结果 。 如 果 i 小 于 文 
点 数 的 索引 , 说 明 我 们 要 找 的 第 i 小 的 数 在 支点 数 的 左边 。 否则 , 需要 返回 的 数 在 支点 
数 的 右边 。 这样, 通过 支点 数 对 输入 序列 进行 划分 后 ,可 以 缩小 寻找 第 i 小 数 的 搜索 范 
围 。 以 上 过 程 可 以 总 结 如 下 (具体 的 算法 见 代 码 6.10): 

e 选择 属于 A 的 支点 数 z 

。 将 A 中 元 素 按照 x 的 大 小 重新 选 位 , 使 得 x 左边 的 元 素 都 比 z 小 , x 右边 的 元 

素 都 比 zx 大, 其 中 支点 数 在 重新 选 位 后 的 序列 中 的 索引 为 了 

。 一 如 果 p == i, 那么 返回 Ai 

一 如 果 p > i, 递归 调用 select_fct(Al[0:p],i) 
一 如 果 p <i, 递归 调用 select_fct(Alp:n 一 1],i 一 p 一 1) 




















@ 这 5 位 作者 除 Pratt 外 , 其 他 4 位 均 获得 了 图 灵 奖 。 


104 算法 设计 与 分 析 (Python) 





代码 6.10 选择 第 大 小 的 数 的 分 治 算法 





def select_fct(array, Kk): 
if len(array) <= 10: # 边界 条 件 
array.sort() 
return array [k] 
pivot = get_pivot(array) # 得 到 数组 的 支点 数 
arTay_lt，arTay_gt，arTay_eq = patition array(array,，pivot) # 按照 支点 数 划 分 
数组 
if k < len(array_1t): # 所 求 数 在 支点 数 左边 
Teturn select_fct(array_lt, k) 
elif k < len(array_1t) + len(array_eq):  # 所 求 数 为 支点 数 
return array_eq[0] 
else: # 所 求 数 在 支点 数 右 边 
normalized k = k - (len(array_lt) + len(array_eq)) 


return select_fct(array_gt, normalized_k) 


以 上 算法 的 关键 便 是 选择 合适 的 支点 数 。 假 如 每 次 我 们 选择 的 支点 数 都 恰好 是 A 中 
的 最 小 值 , 支点 数 的 一 边 为 空 , 其 他 元 素 均 在 支点 数 的 另 一 边 , 这 导致 算法 并 不 能 逐步 
缩小 其 搜索 范围 。 也 就 是 说 , 这 种 情况 下 算法 时 间 复 杂 度 为 T(n) = T(n 一 1) 二 O(n) = 
O(n?) 

那么 该 如 何 选择 支点 数 z 呢 ? Blum 等 人 的 思想 就 是 尽量 让 支点 数 能 将 A 分 为 
两 半 ， 也 就 是 避免 出 现 支点 数 的 一 边 为 空 的 情况 。 其 过 程 可 描述 如 下 ， 算 法 实现 见 
代码 6.11 和 代码 6.12: 

。 将 A 中 的 nn 个 元 素 按照 每 一 组 5 个 元 素 , 分 成 [In/5] 组 

。 找到 每 一 组 的 中 间 数 

。 递归 的 找到 各 组 中 间 数 的 中 间 数 , 将 这 个 中 间 数 作为 支点 数 





代码 6.11 得 到 支点 数 


# 得 到 数组 的 支点 数 

def get_pivot(array) : 
subset_size = 5 # 每 一 组 有 5 个 元 素 
subsets = [] # 用 于 记录 各 组 元 素 


num medians = len(array) / subset_size 





if (len(array) % subset_size) > 0: 


num medians += 1 # 不 能 被 5 整除 
for i in range(num medians): # 划分 成 若干 组 ,每 组 5 个 元 素 


beg = i * subset_size 

end = min(len(array), beg + subset_size) 
subset = array [beg:end] 
subsets.append(subset) 


medians = [] 
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for subset in subsets: 
median = select_fct(subset，1len(subset)/2)  # 计算 每 一 组 的 中 间 数 
medians .append (median) 

pivot = select_fct(medians, len(subset)/2) # 中 间 数 的 中 间 数 


return pivot 





代码 6.12 按照 支点 数 划 分 数组 





# 按照 支点 数 划分 数组 
def patition array(array ,pivot): 
array_lt = [];array_gt = [];array_eq = [] 
for item in array: 
if item < pivot: 
array_1t.append(item) 
elif item > pivot: 
array_gt .append(item) 
else: 
array_eq.append(item) 
return array_lt, array_gt, array_eq 


为 了 验证 算法 可 以 得 到 正确 结果 ,随机 生成 100 个 1 到 1000 之 间 的 随机 数 ( 见 代 
码 6.13)。 然 后, 通过 函数 select_fet( ) 求 得 这 100 个 随机 数 中 第 7 大 的 数 。 最 后 , 将 随 
机 数 排序 , 确定 其 第 7 位 数 与 代码 6.10 中 select_fet( ) 求 得 的 结果 一 致 。 


代码 6.13 选择 第 大 小 的 数 的 主 程序 


import random 
if --name-- == "--main -": 
# 产生 100 个 元 素 的 随机 数组 
num = 100 
array = [random.randint(1,1000) for i in range(num)] 
random. shuffle(array) 
random. shuffle(array) 
# 用 0Cn) 的 算法 得 到 第 k 小 的 数 
k=7 
kval = select_fct(array, k) 
Print (kval) 
# 用 直接 排序 然后 选择 数 的 办 法 得 到 第 k 小 的 数 ， 用 于 验证 算法 正确 性 
sorted array = sorted(array) 


assert sorted array[k] == kval 





一 个 好 的 支点 数 就 是 能 够 尽 可 能 将 A 划分 成 元 素 近 似 相 等 的 两 部 分 。 以 上 寻找 支点 
数 的 算法 就 是 为 了 保证 , 支点 数 左右 两 边 都 有 一 定数 量 的 元 素 , 从 而 使 得 每 次 循环 后 都 
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能 缩小 寻找 范围 。 然 而 ,以 上 求解 支点 数 的 过 程 略 显 复杂 ,其 整个 算法 执行 时 间 能 保证 
为 O(n) 吗 ? 为 了 分 析 方 便 , 将 以 上 算法 总 结 为 如 下 5 步 : 
。 将 输入 序列 按照 每 组 5 个 元 素 进 行 分 组 (函数 select_fct() 第 5 行 调用 函数 
get_pivot( ), 即 函 数 get_pivot( ) 第 3 行 一 第 10 行 ) 
。 找 出 每 一 组 的 中 位 数 (函数 get_pivot( ) 第 14 行 一 第 16 行 ) 
。 递归 调用 select_fct( ), 求 出 这 些 中 位 数 的 中 位 数 作为 支点 数 z (函数 get_pivot( ) 
第 17 行 ) 
。 根据 z 将 输入 序列 进行 划分 (函数 select_fet() 第 6 行 , 即 调用 函数 patition_ 
array( )) 
。 根据 z 与 的 关系 ,递归 调用 select_fct() 函数 ,， 求 出 第 有 大 的 数 (函数 
select_fct( ) 第 7 行 一 第 10 行 ) 
不 妨 设 整个 算法 的 时 间 复 杂 度 记 为 T(n), 算法 的 第 一 步 分 组 执行 时 间 为 O(n); 第 二 
步 找 出 每 一 组 5 个 元 素 的 中 位 数 的 时 间 复 杂 度 也 是 O(n); 第 三 步 递归 调用 select_fct() 
函数 ， 此 时 函数 参数 的 个 数 为 [5/n]， 因 此 这 一 步 时 间 复 杂 度 为 T([5/n1); 第 四 步 中 
函数 patition_array() 含有 一 个 n 次 的 循环 , 每 一 次 循环 执行 时 间 为 常数 ， 因 此 函数 
patition_array( ) 的 时 间 复 杂 度 为 O(n); 第 五 步 函 数 执行 时 间 复 杂 度 为 了 (7n/10)。 这 是 
因为 按照 z 对 输入 序列 划分 后 , 其 中 要 么 至 少 3n/10 个 元 素 小 于 zx, 要 么 至 少 3n/10 个 
元 素 大 于 z (如 图 6.8 所 示 )。 这 样 , 新 的 序列 中 最 多 需要 考虑 的 元 素 个 数 就 是 O(7n/10)。 




















3n/10 





图 6.8 元 素 分 布 示意 图 


因此 , 采用 分 治 算法 求解 序列 第 大 小数 的 时 间 复 杂 度 为 : 
T(n) =T(n/5)+T(7n/10) + en (6.6) 

可 以 证 明 以 上 递归 式 的 解 T(n) = O(n)。 可 以 通过 递归 树 来 求解 以 上 递归 式 , T(n) 
可 以 表示 成 三 个 部 分 , 第 一 部 分 就 是 根 结 点 cn, 另外 两 个 部 分 是 根 结 点 cn 的 左 子 结 点 
与 右 子 结 点 , 它们 分 别 为 T(2n/10) 和 (7n/10) (如 图 6.9 所 示 )。 然后 按照 递归 式 , 分 
别 展开 结 点 T(2n/10) 和 了 T(7n/10), 递归 树 第 二 层 累 加 和 为 c9n/10。 按照 这 个 方式 依次 
展开 递归 树 , 可 以 得 到 : 

T(n) = cn(1 +9/10+ (9/10)?+:…:) 

也 就 是 说 从 树 根 开始 以 下 各 层 是 一 个 几何 级 数 , 因此 累加 各 层 的 值 最 终 得 到 算法 执 

行 时 间 就 是 cn, 即 Blum 等 给 出 的 求解 第 k 小 数 的 算法 时 间 复 杂 度 为 O(n)。 
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问题 规模 : n 网 
pr 大 小 : on 加 
问题 规模 ，2nw/10 5 而 
大 小 :ea2wl0 三 汪 二 问题 规模 :7w/10 和 es | 同 题 规模 :76/10 
ME 大 小 : e710 
第 一 次 递归 展开 
攻 = 一 ] 
问题 规模 : n 
大 小 : on 2n/10 中 的 c 2n/10 2n/10 中 的 c TiW10 
同 题 规模 : 2n/10 ~、 
大 小 : c2n/10 问题 规模 ， 7n/10 2 
大 小 : c7n/10 2n/10 中 的 ce 9n/10 
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5 ,| 第 二 次 递归 展开 





J c (gn/10) :5 








T(n)=cn(1+9/10+ (9/10) 2+...(9/10)™) 
完全 展开 后 结果 


图 6.9 支点 数 问题 的 递归 树 


6.6 ”大 整数 乘法 


6.6.1 ”问题 描述 


1960 年 ， 苏 联 的 伟大 数学 家 Kolmogorov 在 莫斯科 国立 大 学 组 织 了 一 个 讨论 班 。 
在 讨论 班 上 ，Kolmogorov 对 几 个 计算 问题 提出 了 时 间 复 杂 度 为 Q("2) 的 算法 。 讨 论 班 
中 只 有 23 岁 的 Karatsuba 对 于 其 中 一 个 问题 有 不 同 的 见解 ， 这 个 问题 就 是 大 整数 乘 
法 。Karatsuba 提出 了 一 个 利用 分 治 思想 来 实现 大 整数 乘法 的 算法 , 这 个 算法 的 时 间 复 
杂 度 为 @(niog3) ©, 

大 整数 乘法 的 问题 非常 简单 。 给 定 有 个 数 的 整数 和 和 YY, 计算 筹 x 的 值 。 我 
们 可 以 给 出 一 个 最 为 直观 的 算法 , 也 就 是 Y 中 的 每 一 数 与 X 的 个 数 依次 相 乘 ， 如 
图 6.10 所 示 。 这 显然 是 一 个 时 间 复 杂 度 为 @(n?) 的 算法 , 那 Karatsuba 是 如 何 改 进 这 个 
算法 的 呢 ? 





图 6.10 大 整数 乘法 示意 图 





@ 1962 年 , Kolmogorov 根据 讨论 班 的 讨论 , 整理 并 在 期 刊 上 发 表 了 其 中 的 一 些 结果 , 这 里 面 就 包括 了 大 整数 乘法 
的 分 治 算法 。 然 而 , 直到 Karatsuba 收 到 期 刊 的 预 印 本 , 才 知道 他 提出 的 算法 已 经 发 表 , 更 令 他 意 想不到 的 是 , 那 篇 文章 
的 作者 中 并 没有 写 文章 的 Kolmogorov 本 人 。 这 故事 表明 Kolmogorov 不 仅 是 一 位 伟大 的 教育 学 家 , 能 让 学 生 接触 到 当 
时 前 沿 的 研究 ; 也 同时 表现 了 Kolmogorov 的 严谨 治学 和 对 待 名 誉 淡然 的 态度 。 
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6.6.2 ”算法 设计 
Karatsuba 的 解决 思路 是 分 治 的 思想 。 然 而 ， 以 上 问题 该 如 何 得 到 相应 的 子 问 题 ? 
他 首先 把 大 整数 用 低位 和 高 位 来 进行 表示 ,也 就 是 





X=ax10dd+b 
Y=cx10lW2+d 


如 和 = 13579,Y = 24680, 那么 可 将 这 两 个 数 分 解 为 : 


13579 = 135 x 102 十 79 





24680 = 246 x 102 + 80 
有 了 以 上 的 分 解 , 就 可 以 完成 对 原 问 题 的 分 解 , 即 : 


XxY= (ax10W2+b)(c x 10l"™/2 +q) 


(6.7) 
一 acx 102"/2 + (ad 十 be) x 10l™/2 + bd 


式 (6.7) 表明 可 以 将 和 xy 可 以 分 解 成 4 个 规模 较 小 的 子 问 题 , 即 axc, axd,bxc 
和 bx d。 由 于 每 一 个 子 问题 的 规模 为 [z/2]， 四 个 子 问题 相 加 的 时 间 复 杂 度 为 O(n)。 因 
此 , 可 以 得 到 按照 以 上 分 治 算法 得 到 的 时 间 为 : 
T(n) = 4T([n/2]) + O(n) = O(n?) (6.8) 
非常 有 意思 的 是 , 尽管 我 们 用 了 分 治 算法 来 求解 问题 , 但 最 终 的 时 间 复 杂 度 与 直接 
相 乘 的 算法 时 间 复 杂 度 一 样 , 都 是 O(nw2)。Karatsuba 是 怎么 使 用 分 治 算法 的 呢 ? 他 考虑 
的 方向 是 能 不 能 减少 子 问题 的 个 数 。Karatsuba 观察 到 : 
E=ac 
F=bd (6.9) 
G=act+ad+bc+bd= (a+b)(c+d) 





因此 , 可 得 : 
ad+bc=G—E-F (6.10) 
将 以 上 带 入 式 (6.7), 得 到 
XxY=Ex10"d+(G—B-F)x10"d+F (6.11) 
也 就 是 说 原来 四 个 子 问 题 a x c, a x d, b x c 和 bx d, 变 成 了 现在 的 三 个 子 问题 
五 , 随和 GO。 由 于 位 数 的 加 法 时 间 复杂 度 依然 是 O(n), 因此 Karatsuba 算法 的 时 间 


复杂 度 为 : 
T(n) = 37([n/2]) + O(n) = O(n®s3) = O(nts85) (6.12) 





@ G 仍然 是 一 个 两 个 数 相 乘 的 子 问题 , 其 中 一 个 数 为 a 十 b, 另 一 个 数 为 c 十 d。 
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当 n 是 够 大 时 , O(n1535) 比 O(m2) 要 小 很 多 。 因 此, 这 个 例子 再 次 告诉 我 们 , 用 了 
分 治 算法 求解 问题 并 不 一 定 意味 着 算法 效率 的 提高 , 具体 的 时 间 复 杂 度 依然 需要 通过 计 
算 才 能 确定 。 此外, 除了 提高 合并 子 问 题解 的 效率 , 减 小 子 问 题 数 也 是 优化 分 治 算法 的 
有 效 手段 。 


6.7 小 结 


分 治 算法 的 思想 就 是 将 复杂 问题 分 解 为 简单 的 子 问 题 , 然后 寻求 子 问题 的 递归 解 ， 
并 组 合 各 个 子 问题 的 解 以 期 得 到 最 终 复杂 问题 的 解 。 统 计 逆 序 、 股 票 买卖 和 空间 点 最 近 
距离 的 问题 , 用 分 治 算法 求解 时 其 难点 主要 在 于 解 可 能 存在 跨 界 的 情况 。 也 就 是 说 , 原 
问题 的 解 等 于 子 问 题 的 解 加 上 跨 界 部 分 的 解 。 在 考察 跨 界 部 分 的 解 时 ， 需 要 充分 考虑 解 
的 结构 ， 从 而 尽 可 能 缩小 解 的 范围 。 比 如 , 在 求 空间 点 最 近 距 离 问 题 时 , 将 原来 处 理 跨 界 
时 的 时 间 复 杂 度 从 O(n2) 降 到 了 O(n), 就 是 充分 利用 到 解 结构 的 信息 。 

对 于 利用 分 治 算法 求解 的 问题 , 并 不 总 是 简单 的 将 问题 一 分 为 二 就 可 以 得 到 子 问 
题 。 比 如 , 寻找 第 大 小 的 数 时 ， 就 需要 设计 巧妙 的 方法 来 合理 的 将 原 问题 进行 划分 。 当 
然 , 划分 的 结果 一 定 是 得 到 比 原 问题 规模 更 小 的 子 问题 。 此 外 ,各 个 子 问题 的 规模 大 小 
并 未 有 一 个 统一 标准 。 

同时 , 我 们 也 需要 知道 不 一 定 用 了 分 治 算法 就 可 以 得 到 一 个 高 效 的 算法 。 这 就 好 比 
我 们 在 训 饪 时 ,， 加 了 很 多 辣椒 烧 出 的 并 不 一 定 就 是 川菜 。 算法 是 否 高 效 ， 是 通过 分 析 其 
时 间 复 杂 度 得 到 的 ， 而 不 是 说 用 了 某 个 算法 就 一 定 高 效 。 

分 治 算法 中 把 复杂 问题 转化 为 简单 子 问题 ， 并 利用 递归 求解 子 问题 的 方法 与 第 4 章 
的 递归 算法 基本 一 样 。 那 么 , 这 两 个 算法 有 什么 不 一 样 的 地 方 呢 ? 相 比 较 于 递归 算法 , 分 
治 算法 包含 有 合并 子 问题 解 的 过 程 , 而 组 合子 问题 的 解 往往 是 分 治 算法 最 为 重要 的 一 个 
步骤 ,对 算法 最 终 的 时 间 复 杂 度 有 着 重要 影响 。 





课 后 习题 


习题 6-1 ”序列 连续 和 问题 

给 定 一 组 股票 价格 A=[10, 11, 7, 10, 6], 将 每 日 股票 的 价格 变 成 前 后 两 天 的 收益 差 ， 
即 B=[1, 一 4, 3, 一 4。 

(a) 给 定 B, 求 出 连续 序列 累加 和 最 大 的 部 分 。 

(b) 设计 一 个 时 间 复 杂 度 为 O(nlogn) 的 算法 , 求解 序列 连续 累加 和 的 最 大 值 。 

(ce) 设计 一 个 时 间 复 杂 度 为 O(n) 的 算法 , 求解 序列 连续 累加 和 的 最 大 值 。 


习题 6-2 ”索引 与 序列 值 问 题 
给 定 n 个 元 素 的 有 序 序列 A, 对 于 A 中 的 索引 i, 给 定 一 个 算法 判定 是 否 A[i] = i。 
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习题 6-3” 凸 多 边 形 问 题 

给 定 空间 中 m 个 坐标 点 ， 这 些 点 构成 一 个 凸 多 边 形 。 任 意 给 定 一 点 g, 设计 一 个 时 
间 复 杂 度 为 O(logn) 的 算法 判定 点 g 是 否 落 在 凸 多 变形 内 。 
习题 6-4 ”序列 查找 

给 定 一 个 元 素 只 有 0 或 者 1 的 序列 , 该 序列 中 的 1 后 面 一 定 为 0, 设计 算法 找 出 序 
列 中 0 的 个 数 。 比 如 A=[1, 1, 1, 1, 0, 0], 则 输出 为 2。 
习题 6-5 ”整数 的 均 方 根 

给 定 一 个 整数 zx, 设计 算法 找 出 z 均 方 根 值 。 如 果 没 有 均 方 根 , 则 取 最 接近 的 整数 。 
如 z= 4, 则 输出 2; z = 11, 则 输出 3。 


第 7 章 图 搜索 算法 


本 章 学 习 目 标 
。 人 掌握 图 的 两 种 存储 方法 ， 了 解 它 们 各 自 的 优 缺 点 
。 熟悉 宽度 与 深度 优先 搜索 算法 及 其 时 间 复 杂 度 分 析 
。 了解 通过 宽度 或 深度 优先 搜索 解决 计算 问题 的 方法 


7.1 引言 


图 是 一 种 重要 的 建 模 工 具 ， 从 考古 、 心 理学 到 人 工 智能 等 领域 都 有 广泛 的 应 用 。 计 
算 机 科学 的 许多 问题 都 可 以 通过 图 来 进行 建 模 ， 而 一 旦 将 问题 转化 成 一 个 图 模型 ， 那 么 
问题 的 求解 往往 就 变 成 在 图 上 进行 遍历 的 过 程 。 本 章 将 主要 介绍 两 个 常见 的 在 图 上 遍历 
的 算法 ， 即 宽度 优先 搜索 (Breadth-First Search, BFS) 和 深度 优先 搜索 (Depth-First 
Search, DFS), 并 介绍 利用 这 两 种 搜索 算法 在 求解 计算 问题 中 的 应 用 。 

为 了 更 好 地 理解 图 ,首先 简单 回顾 一 下 图 的 定义 。 图 G 是 点 V 和 边 卫 的 集合 ， ? 
为 G=(V, B)。 其 中 , V 表示 图 中 结 点 的 集合 , EB 则 表示 图 中 边 的 集合 , 一 条 边 也 可 以 看 
作 是 两 个 结 点 对 。 

图 7.1 中 就 是 两 个 典型 的 图 。 其 中 , 图 7.1(a) 是 无 向 图 , 即 边 没有 方向 ; 图 7.1(b) 是 
有 向 图 , 也 就 是 连接 结 点 的 边 具有 方向 性 。 比 如 , 两 图 中 都 有 从 结 点 a 到 b 的 边 , 如 果 有 
信息 需要 在 这 两 个 结 点 间 流 动 , 那么 对 于 图 7.1(a) 而 言 , 信息 可 以 从 a 结 点 流向 b 结 点 ， 
也 可 以 从 b 结 点 流向 a 结 点 。 但 是 , 图 7.1(b) 的 信息 只 能 从 a 结 点 流向 b 结 点 。 如 果 
用 结 点 与 边 的 集合 来 表示 这 两 幅 图 , 那么 图 7.1(a) 结 点 集合 V=[a, b, c, dj, 边 的 集合 为 


oN 


(a) (b) 
图 7.1 无 向 图 与 有 向 图 
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E=[[a, bl, [a, dj, [b, dj, [c, dj]。 也 就 是 说 ，[a, b] 表示 从 结 点 a 到 结 点 b 的 边 , 以 及 从 结 
点 b 到 结 点 a 的 边 。 图 7.1(b) 结 点 集合 V=[a, b, cl, 边 的 集合 E=[(a, b), (b, ¢), (c, b)， 
(c, a)]。 括 号 表示 了 方向 , 即 (a, b) 表示 从 结 点 a 到 结 点 b 的 联接 。 


7.2 ”图 搜索 的 应 用 


许多 计算 问题 都 可 以 利用 图 来 进行 建 模 , 且 最 后 问题 的 求解 过 程 往往 就 是 在 图 上 进 
行 遍历 。 图 的 遍历 一 般 可 认为 是 从 图 中 开始 结 点 开始 , 按照 图 中 的 边 寻找 一 条 达到 某 个 
期 望 结 点 的 路 径 。 路径 就 是 结 点 的 序列 ， 如 图 7.1(b), 结 点 (a, b, e) 就 是 一 条 从 结 点 a 
到 结 点 c 的 路 径 。 此外, 图 的 遍历 也 有 可 能 是 经 过 图 中 每 一 个 结 点 , 或 者 从 初始 结 点 能 
够 达到 的 结 点 集合 。 比 如 图 7.1(b), 结 点 b 可 达 的 结 点 集合 就 是 [c, a]。 

到 底 有 哪些 计算 问题 可 以 转化 为 图 的 搜索 问题 呢 ? 为 了 使 读者 对 于 图 的 应 用 有 更 加 
直观 的 印象 , 下 面 我 们 介绍 图 的 几 个 典型 应 用 场景 。 
网 页 怜 虫 
互联 网 时 代 最 常用 的 应 用 之 一 , 就 是 搜索 引擎 ,比如 Google 和 Baidu 等 。 搜索 引擎 
提供 的 应 用 , 就 是 根据 用 户 输入 的 字符 串 找到 相关 的 网 页 。 为 了 实现 这 个 功能 , 搜索 引 
擎 需要 用 到 一 个 被 称 为 网 页 爬虫 的 程序 。 该 程序 的 主要 功能 就 是 建立 网 页 的 索引 ,这样 
在 用 户 输入 字符 串 后 就 可 以 很 快 地 返回 相关 网 页 。 
由 于 网 络 上 网 页 非常 多 ,因此 需要 按照 一 定 的 规则 去 找到 相关 网 页 。 网 页 爬虫 程序 
会 从 某 一 个 页 面 开始 ， 然 后 根据 这 个 页 面 的 链接 找到 所 有 的 子 页 面 。 再 从 各 个 子 页 面 开 
始 , 根据 该 页 面 的 链接 找到 它 的 所 有 子 页 面 。 每 一 个 页 面 对 应 于 图 中 的 一 个 结 点 , 页 面 
之 间 的 链接 则 对 应 于 结 点 之 间 的 边 。 仆 虫 寻找 页 面 过 程 就 相当 于 在 图 中 按 层 遍历 各 个 页 

社交 网 络 

互联 网 时 代 也 把 人 们 通过 网 络 连接 了 起 来 ， 比 如 微 信 、 博客 和 脸 书 (Facebook) 等 。 
社交 网 络 中 一 个 非常 重要 的 应 用 就 是 朋友 图 ,也 就 是 你 朋友 的 朋友 有 很 大 概率 能 成 为 你 
的 朋友 。 那么 该 把 哪些 人 推荐 给 你 , 作为 潜在 的 朋友 呢 ? 可 以 将 社交 网 络 中 的 每 一 个 人 
对 应 于 图 中 的 结 点 ,是 朋友 关系 的 两 个 人 用 一 条 边 进行 连接 。 这 样 就 可 以 构造 一 个 非常 
庞大 的 社交 网 络 。 如 果 系 统 要 给 你 推荐 朋友 , 就 可 以 先 找到 你 所 有 的 朋友 , 然后 将 你 朋 
友 的 朋友 推荐 给 你 。 

垃圾 回收 

垃圾 回收 (Garbage Collection) 是 许多 高 级 程序 设计 语言 具有 的 一 项 内 存 管理 机 
制 ，Java 和 C# 等 语言 都 有 这 项 机 制 。 它 的 主要 功能 是 当 需 要 分 配 的 内 存 空 间 不 再 使 用 
的 时 候 , 通过 调用 垃圾 回收 机 制 来 回收 内 存 空间 。 

垃圾 回收 的 原理 是 : 系统 管理 着 所 有 已 经 创建 了 的 对 象 。 每 个 对 象 都 有 对 其 他 对 象 
的 引用 。root 集合 代表 着 已 知 的 系统 级 别 的 对 象 引用 。 我们 从 root 集合 出 发 , 就 可 以 访 
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问 到 系统 引用 到 的 所 有 对 象 。 而 没有 被 访问 到 的 对 象 就 是 垃圾 对 象 ， 需 要 被 销毁 。 对 象 
就 对 应 图 中 的 结 点 , 引用 关系 则 对 应 图 中 的 边 。 

点 对 点 网 络 

在 网 上 下 载 资料 最 常用 的 就 是 用 点 对 点 (Peer to Peer, P2P) 的 下 载 模式 ， 比 如 
BitTorrent 就 是 一 个 点 对 点 网 络 下 载 系统 。 这 类 系统 没有 客户 端 或 服务 器 的 概念 ,只 有 
平等 的 同 级 结 点 , 网 络 上 的 其 他 结 点 充当 客户 端 和 服务 器 。P2P 网 络 中 的 一 台 机 器 就 对 
应 图 中 的 一 个 结 点 , 寻找 该 台 机 器 所 有 邻居 机 器 的 算法 就 是 一 个 典型 的 图 搜索 算法 。 

从 以 上 介绍 的 典型 应 用 不 难看 出 , 问题 求解 过 程 可 以 先 构 建 问题 的 图 模型 ， 即 确定 
结 点 和 边 在 问题 中 的 意义 , 再 将 问题 的 求解 转化 为 图 中 结 点 的 遍历 。 





7.3 ”图 的 表示 


根据 图 的 定义 , 我 们 知道 图 是 结 点 与 边 的 集合 。 那么 如 何在 计算 机 中 存储 图 呢 ? 本 
书 将 采用 邻接 表 存 储 法 将 图 数字 化 存储 。 也 就 是 将 图 中 每 一 个 结 点 ve V 对 应 于 一 个 邻 
接 表 的 表 头 ， 所 有 与 该 结 点 v 连接 的 其 他 结 点 u = Adj(v), u€ V，(v, u) € BE 都 与 该 结 
点 v 通过 链 将 它们 连接 , 其 中 Adj(v) 表示 取得 结 点 v 所 有 邻居 结 点 集 的 函数 。 

如 图 7.2 所 示 ，Adj(a)=[bl，Adj(b)=[q,，Adj(@=[a, bj。 以 结 点 e 为 例 , 与 该 结 点 相 
连接 的 结 点 的 有 a 和 b, 即 Adj(c)=[a, b], 意味 着 存在 边 c 一 a 和 边 c 一 b。 如 果 图 是 无 
向 的 ， 比 如 图 7.1 左 图 中 结 点 a 和 b, 则 可 以 表示 成 Adj(a)=[b, dj，Adj(b)=[a, dj]。 意 味 
着 存在 a 一 b 和 b 一 a 两 个 方向 的 连接 。 


oO * 
ZN » | 
@Y  ) c b | a 


图 7.2 图 的 列表 表示 法 






































Adj 


函数 Adj(v) 返回 与 其 输入 结 点 v 对 应 的 所 有 连接 的 结 点 集合 。 可 以 用 Python 中 
的 字典 结构 来 实现 结 点 之 间 的 连接 关系 。 图 7.2 所 示 的 图 可 以 按照 代码 7.1 来 表示 。 代 
码 7.1 中 的 graph 为 图 的 名 称 , 是 字典 类 型 变量 。graph 的 key 分 别 为 结 点 'a', 'b' 和 'c'。 
key 对 应 的 value 就 是 各 个 结 点 相 邻 的 结 点 集合 。 


代码 7.1 利用 字典 数据 类 型 存储 图 





1 graph = {'a': ['b'], 
2 be nes 
3 ve Em 
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将 图 存储 后 , 就 可 以 根据 该 图 实现 一 些 简单 功能 。 比 如 , 打印 出 图 所 有 的 边 , 其 实现 
见 代码 7.2。 代 码 第 3 行 的 循环 将 遍历 图 中 所 有 结 点 , 而 第 4 行 的 循环 则 遍历 结 点 node 
的 各 个 邻居 结 点 。 代码 7.2 通过 两 重 循环 实现 了 遍历 图 graph 中 各 个 边 的 功能 ,其 时 间 
复杂 度 为 O(|E|), |B| 表示 边 的 数量 。 


代码 7.2 得 到 图 所 有 的 边 





def generate_edges(graph) : 
edges = [] 
for node in graph: 
for neighbour in graph[node] : 
edges.append( (node, neighbour)) 
return edges 


如 果 调 用 该 函数 print(generate_edges(graph)), 就 可 以 得 到 图 7.2 中 边 的 集合 , 即 ; 
Mas Bb); {er 'a'), (er pb); (BS oy 
除了 利用 邻接 表 来 表示 图 之 外 ,也 可 以 采用 和 矩阵 来 存储 图 。 假定 A=[ai;] 是 一 个 
nxn 的 矩阵 ，aiy 表示 矩阵 第 i 行 第 7 列 的 元 素 , 它 的 值 为 : 
1; 如 果 (i,j) Ee 也 ， 
Qij 一 

0; 其 他 。 

由 此 可 得 图 7.2 的 邻接 矩阵 表示 为 : 





矩阵 的 第 1 行 第 1 列 为 0, 因为 图 中 没有 从 结 点 a 到 结 点 a 的 边 。 图 中 有 从 结 点 a 
到 结 点 b 的 边 , 所 以 矩阵 的 第 1 行 第 2 列 为 1。 如 果 需 要 存储 的 图 非常 稀疏 ， 即 矩阵 中 
大 部 分 元 素 的 值 都 是 0, 那么 采用 邻接 矩阵 存储 将 会 造成 很 多 空间 损失 。 此 时 利用 邻接 
表 存 储 图 更 为 合适 , 它 所 占用 的 空间 复杂 度 为 O(|V| 十 |B|), 也 就 是 所 有 边 数 加 上 所 有 
结 点 数 , |V| 表示 结 点 数量 , |E| 表示 边 的 数量 。 

现实 生活 中 的 图 大 多 是 稀疏 的 , 读者 可 以 画 一 幅 所 在 班级 同学 的 关系 图 来 验证 这 一 
点 。 图 中 结 点 表示 同学 , 如果 两 个 同学 在 一 学 期 中 有 2 次 以 上 一 起 在 食堂 就 餐 , 就 在 这 
两 点 之 间 画 一 条 边 ， 然 后 采用 矩阵 的 方式 存储 该 图 , 并 计算 矩阵 中 0 的 占 比 。 


7.4 ”宽度 优先 搜索 


7.4.1 ”宽度 优先 搜索 算法 


在 完成 对 图 的 存储 后 ， 本 节 将 介绍 图 中 常用 的 一 个 遍历 所 有 结 点 的 算法 。 该 算法 称 
为 宽度 优先 遍历 。BFS 最 直接 的 应 用 就 是 在 单 源 边 无 权重 的 图 中 , 确定 其 他 结 点 与 源 
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点 之 间 的 最 短 距离 。 由 于 各 边 无 权重 ,因此 源 点 到 各 个 结 点 的 最 短路 径 就 是 从 源 点 到 
各 结 点 跳跃 次 数 最 少 的 路 径 。BFS 算法 由 E.F.Moore 在 20 世纪 50 年 代 提出 ,1961 年 
C.Y.Lee 在 研究 路 由 算法 时 , 也 独立 的 发 现 了 BFS 算法 。 

BFS 算法 简单 的 说 就 是 按照 层 来 遍历 图 中 的 结 点 。 首 先 ,遍历 源 点 s， 然 后 遍历 所 
有 与 源 点 有 连接 的 结 点 集 V1 e V，, 再 依次 遍历 与 结 点 集 V1 中 的 结 点 有 连接 的 下 一 层 所 
有 结 点 集 V2 e V, 依 此 直到 遍历 完 所 有 的 结 点 。 

图 的 存储 依然 采用 邻接 列表 的 方式 存储 , 通过 设计 一 个 Graph 类 来 表示 图 。Graph 
类 中 的 成 员 变量 为 字典 类 型 变量 adj, 用 于 存储 图 中 每 一 个 结 点 的 邻 边 , 成 员 函 数 
add_edge(uv) 将 两 个 结 点 u 和 v 建立 连接 ,Graph 类 见 代 码 7.3 的 第 1 一 7 行 。 








代码 7.3 图 与 BFS 结果 类 定义 


class Graph: 
def __init__(self): 
self.adj = {} 
def add_edge(self, u, V): 
if self.adj[u] is None: 
self.adj[u] = [] 
self.adj [u] .append(v) 


class BFSResult: 
def __init__(self): 
self.level = {} 
self .parent = {} 


设计 一 个 BFSResult 类 来 存储 BFS 的 输出 结果 ， 见 代码 7.3 的 第 9 行 ~ 12 行 。 一 
个 字典 类 型 的 变量 level 来 存储 各 层 结 点 。level 的 key 对 应 层 的 结 点 ，level 的 value 则 
是 层 的 标号 。 以 图 7.3 为 例 , level[s]=0 表示 第 0 层 的 结 点 为 s, levella]=1 和 level[x]=1 
表示 第 1 层 的 结 点 为 a 和 x。 为 了 便于 索引 , 还 使 用 一 个 字典 变量 parent 来 记录 结 点 的 








父 结 点 。 同 样 以 图 7.3 为 例 , parent[aj=s 表示 结 点 a 的 父 结 点 为 结 点 s。 
8 。 
level0 jt 
levell level 
level2 


图 7.3 BFS 示意 图 


以 图 7.4 为 例 , 按照 BFS 遍历 该 图 的 过 程 如 下 : 首先 , 将 初始 结 点 s 设置 为 第 0 层 ， 
然后 找 出 结 点 s 的 所 有 邻居 结 点 , 其 中 还 没有 被 遍历 到 的 结 点 就 将 它们 作为 第 1 层 的 结 
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level 0 

frontier = {s} 
frontier! = {a, x} 
frontier, = {z, d, c} 
frontiers = { v} 


(not x, c, d) 





level 2 level 3 


图 7.4 BFS 示例 





点 。 再 找 出 第 1 层 结 点 的 邻居 结 点 ， 所 有 未 遍历 的 结 点 作为 第 2 层 结 点 。 依 次 遍历 完 图 
中 所 有 结 点 , 可 得 BFS 的 流程 为 : 

。 将 源 点 置 为 第 0 层 , level[0] = s 

。 从 源 点 s 到 该 第 i 层 每 一 个 结 点 需要 经 过 i 条 边 

。 第 i 层 的 每 一 个 结 点 均 来 自前 一 层 i 一 1。 其 中 , i=1, 2, … 为 层 数 索引 

BFS 的 实现 见 代 码 7.4, 代码 中 函数 bfs 的 输入 参数 为 图 G 和 初始 结 点 s。 第 2 一 4 
行 初始 化 输出 对 象 r。 变量 i 索引 层 数 , 列表 变量 frontier 存储 当前 层 的 结 点 , 列表 变量 
next 存储 frontier 中 所 有 下 一 层 的 结 点 。 对 于 frontier 中 每 一 个 结 点 u, 找 出 u 的 所 有 
邻居 结 点 v( 代 码 7.4 第 11 行 )， 如 果 邻 居 结 点 没有 遍历 (代码 7.4 第 12 行 ), 则 该 结 点 v 
是 下 一 层 的 结 点 。 处 理 完 frontier 中 所 有 结 点 后 , 用 next 对 它 重 置 。 通 过 判断 frontier 
是 否 为 空 (代码 7.4 第 8 行 ) 来 作为 循环 是 否 继续 的 条 件 。 





代码 7.4 宽度 优先 搜索 


def bfs(g, s): 
r = BFSResult() 
r.parent = {s:None} 
r.level = {s:0} 


i=1 
frontier = [s] 
while frontier: 
next = [] 
for u in frontier: 
for v in g.adj [u] : 
if V not in r.level: 
r.level[v]=i 
r.parent [v]=u 
next .append(v) 
frontier = next 
i+=1 


returnr 
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采用 代码 7.4 来 对 图 7.4 进行 宽度 优先 搜索 。frontiero 的 初始 值 等 于 {s}, 下 标 0 表 
示 循 环 次 数 。 第 一 次 循环 后 , frontieri={fa, x}。 第 二 次 循环 后 ,frontier?={z, d, c}。 第 三 
次 循环 后 , frontiers={f, v}。 第 四 次 循环 时 ，frontier 等 于 空 ， 循 环 结束 。 


7.4.2 ”BFS 算法 分 析 


代码 7.4 中 , 共有 3 重 循环 。 其 中 ,变量 frontier 存储 的 是 当前 层 的 结 点 ， 也 就 是 
说 ， 最 外 层 循 环 的 循环 次 数 为 图 的 层 数 。 如 图 7.4 所 示 的 外 循环 次 数 为 3。 算 法 第 二 重 循 
环 也 就 是 遍历 了 frontier 中 所 有 出 现 的 结 点 。 为 了 分 析 方 便 , 我 们 直接 考察 结 点 出 现在 
frontier 中 的 次 数 。 

从 算法 中 不 难 发 现 , 图 中 结 点 均 会 在 frontier 中 出 现 一 次 。 这 是 因为 frontier 每 次 循 
环 后 存储 的 是 当前 level 的 结 点 ， 已 经 遍历 过 的 结 点 就 不 会 再 出 现在 frontier 中 。 

第 三 重 循环 对 frontier 中 每 一 个 结 点 ， 找 与 其 相 邻 的 结 点 ， 也 就 是 遍历 图 中 所 有 的 
边 , 其 时 间 复 杂 度 为 O(|E|)。 因 此 ,BFS 算法 执行 时 间 包 括 遍历 每 一 个 结 点 及 图 中 各 个 
边 的 时 间 ， 即 其 时 间 复 杂 度 为 O(|E| 十 |V|)。 








7.4.3 ”BFS 算法 应 用 举例 


7.4.3.1 “最短 路径 
给 定 无 向 图 G=(V, E), 求 从 源 点 s 到 图 中 各 个 结 点 v EV 的 最 近 距 离 。 如 图 7.4 所 
示 ， 从 源 点 s 到 结 点 d, c 和 z 的 最 短 距离 均 为 2, 而 到 结 点 f 和 v 的 最 短 距离 则 为 3。 


代码 7.5 利用 BFS 求 最 短路 径 


if --name-- == "--main _": 
g = Graph() 
g.adj = { ms" : [an,nx]， 


an : [wznynsm]， 


i i 
ems Er Warmerny 
a Se ee el 

nF i a 
人 | Sle 

we [] 


} 


bfs_result = bfs(g, 's') 
Print(bfs_result.level) 
print(find_shortest_path(bfs_result，'f')) 





根据 BFS 算法 , 很 容易 求 得 图 7.4 各 点 的 最 短 距离 。 最 短 距离 就 是 查询 各 个 结 点 v 
所 处 level 的 值 , 如 果 执行 代码 7.5, 则 可 以 得 到 如 下 结果 : 


| 


om yo nm po 
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如 果 要 获得 距离 的 路 径 ， 比如 从 s 到 结 点 v 的 路 径 , 则 可 以 通过 获取 v 的 父 结 点 


parent[v]。 再 获得 其 父 结 点 的 父 结 点 , 即 parent[parent[v]], 依次 进行 直到 源 点 s。 其 实现 
过 程 见 代 码 7.6。 


代码 7.6 返回 最 短路 径 





def find_shortest_path(bfs_result, V): 
source_vertex = [verterx for verterx, level in bfs_result.level.items() if 
— level == 0] 
v_parent_list = [] 
if Vv != source_vertex[0] : 

V_parent = bfs_result.parent[v] 

V_parent_list.append(v_parent) 

While v_parent != source_vertex[0] and v_parent != None: 
V_parent = bfs_result.parent[v_parent] 
V_parent_list.append(V_parent) 

return v_parent_list 


代码 7.6 中 函数 find_shortest_path( ) 有 两 个 参数 bfs_result 和 v, 其 中 bfs_result 
是 执行 BFS 后 的 结果 , v 是 需要 确定 最 短路 径 的 结 点 。 代码 7.6 第 2 行 首先 求 得 图 中 的 
源 结 点 , 最 短路 径 用 变量 v_parent_list 存储 。 第 7 一 9 行 的 循环 为 求解 结 点 v 父 结 点 的 
父 结 点 ,， 直到 源 点 为 止 。 记录 下 这 之 间 经 过 的 各 个 结 点 v_parent, 就 是 从 源 点 到 结 点 v 
的 最 短路 径 。 图 7.4 中 结 点 f 的 最 短路 径 输出 结果 为 ['d', 'x', 's1]。 
7.4.3.2 ” 虎 胆 龙 威 难 题 

虎 胆 龙 威 是 美国 演员 布鲁斯 。 威 利 斯 的 成 名 系列 电影 ， 威 利 斯 饰演 的 警察 角色 总 是 
能 化 解 各 种 危险 的 困 局 。 在 虎 胆 龙 威 第 三 集 , 布鲁斯 。 威 利 斯 所 扮演 的 警察 与 他 的 搭档 
过 到 了 一 个 难题 , 需要 他 们 装 出 一 桶 4 加 仓 的 汽油 ， 从 而 通过 这 桶 汽油 的 重力 用 来 解除 
炸弹 威胁 。 然而, 他 们 并 没有 磅 秤 ， 有 的 只 是 两 个 5 加 仓 和 3 加 仓 的 空 瓶子 , 这 次 布 鲁 
斯 该 如 何 来 解决 这 个 难题 呢 ? 

我 们 首先 来 看 在 电影 情节 中 , 威 利 斯 和 他 的 搭档 是 这 么 做 的 : 

(1) 给 5 加 仓 的 瓶子 充满 汽油 ,3 加 仓 的 瓶子 为 空 ; 

(2) 从 5 加 仓 的 瓶子 给 3 加 仓 的 瓶子 加 满 汽 油 , 这 样 5 加 仓 的 瓶子 中 还 剩 下 2 加 仑 ; 

(3) 倒 空 3 加 仑 瓶子 里 面 的 汽油 ; 

(4) 将 5 加 仓 瓶 子 中 剩 下 的 2 加 仓 汽油 倒 入 3 加 仓 的 瓶子 ; 

(5) 再 次 将 5 加 仓 瓶 子 加 满 ; 

(6) 然后 从 5 加 仑 瓶子 中 往 3 加 仓 瓶 子 中 加 汽油 , 让 3 加 仑 瓶子 加 满 。 
于 3 加 仓 瓶 子 原 来 有 2 加 仓 汽油 , 那么 从 5 加 仓 瓶 子 倒 出 的 汽油 数 为 1 加 仓 。 
此 , 5 加 仓 瓶子 中 剩 下 的 就 是 4 加 仑 汽油 。 其 过 程 见 图 7.5。 

以 上 问题 可 以 用 图 来 进行 建 模 。 图 中 每 一 个 结 点 表示 一 个 状态 , 状态 包括 二 元 组 (a， 
b)。 其 中 , a 表示 5 加 仑 瓶子 中 的 含油 量 , b 则 表示 3 加 仓 瓶 子 中 的 含油 量 。 我们 的 初始 
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图 7.5 无 秤 精准 装 水 求解 示意 图 


状态 为 (0, 0), 也 就 是 两 个 瓶子 都 是 空 的 。 而 我 们 期 望 达到 的 状态 是 (4, 0)。 图 中 结 点 与 
结 点 之 间 的 边 表示 状态 转移 ， 允 许 的 状态 转移 有 : 

。 填 满 一 个 瓶子 

。 倒 空 一 个 瓶子 

。 从 一 个 瓶子 往 另 外 一 个 瓶子 倒 油 ， 直到 被 倒 入 瓶子 装 满 或 者 另外 一 个 瓶子 为 空 

图 7.6 中 , (0, 0) 是 初始 状态 ,按照 三 个 允许 的 状态 转移 ， 该 初始 状态 可 达 的 状态 有 
(0, 3) 和 (5, 0)。 也 就 是 装 满 5 加 仓 的 桶 , 或 者 装 满 3 加 仑 的 桶 。 由 于 初始 状态 两 个 桶 都 
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图 7.6 利用 BFS 求解 无 秤 精准 装 水 
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是 空 , 因此 倒 空 或 者 相互 倾倒 都 不 可 能 。 然后 再 考虑 状态 (0, 3), 考察 它 可 以 扩展 成 什么 
状态 。 该 状态 下 , 要 么 往 5 加 仑 油 桶 加 满 成 为 状态 (5, 3), 或 者 把 3 加 仑 桶 里 的 油 倾倒 至 
5 加 仓 的 桶 成 为 状态 (3, 0)。 由 此 , 可 得 如 图 7.6 所 示 的 状态 转换 图 。 

为 了 实现 以 上 算法 , 与 BFS 类似, 构造 BFSDieHardResult 类 来 存储 结果 。 
BFSDieHardResult 类 中 有 记录 每 层 结 点 的 字典 类 型 变量 level 和 记录 结 点 父 结 点 的 
字典 类 型 变量 parent， 如 代码 7.7 所 示 。 





代码 7.7 定义 输出 结果 类 





class BFSDieHardResult : 
def __init__(self): 
self.level = {} 
self.parent = {} 


然后 ， 再 由 函数 find_next_state(u, jug) 来 确定 当前 结 点 u 的 下 一 个 状态 ,其 中 
jug=(5, 3) 表示 两 个 桶 的 容量 。 按照 前 面 定 义 的 三 个 可 行 的 状态 转移 , 分 别 计算 装 满 一 
个 桶 、 倒 空 一 个 桶 或 者 相互 倾倒 的 情况 。 在 相互 倾倒 时 需要 考察 倒 入 桶 与 被 倒 入 桶 各 自 
已 有 的 容量 ， 从 而 得 到 如 代码 7.8 所 示 的 实现 过 程 。 


代码 7.8 寻找 下 一 个 状态 


def find next_state(u, jug): 
next_state = [] 
if u[0] < jug[0]: # 注 满 第 一 个 杯子 
next_state.append((jug[0], u[1])) 
if u[1] < jug[1]: # 注 满 第 二 个 杯子 
next_state.append((u[0] ,jug[1])) 
if u[0]>0: # 倒 掉 第 一 杯子 里 面 的 东西 
next_state.append((0, u[1])) 
if u[1] > 0: # 倒 掉 第 二 杯子 里 面 的 东西 
next_state.append((u[0] ，0)) 
if u[0]<jug[0]: # 第 一 杯 有 空余 
if u[1] >= jug[0]- u[0]: 
next_state.append((jug[0], u[1]-(jug[0]- u[0]))) 
if jug[0]- u[0] > u[1] and u[1] > 0: 
next_state.append((u[0]+u[1], 0)) 
if u[1]<jug[1]: # 第 二 杯 有 空余 
if u[0] >= jug[1]- ul[1]: 
next_state.append((u[0]-(jug[1]- u[1]), jug[1])) 
if jug[1]- u[1] > u[0] and u[0] > 0: 
next_state.append((0, jug[1])) 
return next_state 








有 了 函数 find_next_state(u, jug) 后 ,就 可 以 设计 BFS 来 调用 该 函数 。 这 里 BFS 的 
实现 bfs_diehard(start, end, jug) 与 代码 7.4 类 似 , 只 需要 将 代码 7.4 第 11 行 的 g.adj[u] 
改 成 find_next_state(u, jug), 再 增加 一 个 是 否 达 到 结束 状态 end 的 条 件 判 断 即 可 。 函 数 


第 7 章 图 搜索 算法 121 





bfs_diehard( ) 的 参数 start 表示 初始 状态 , 设 start=(0, 0)。 读者 可 以 自行 完成 这 个 函数 
的 编写 , 并 利用 与 布鲁斯 一 样 的 数据 测试 代码 的 正确 性 。 


7.5 ”深度 优先 搜索 


深度 优先 搜索 与 BFS 类 似 , 都 是 遍历 图 上 所 有 的 结 点 。 然而,，DFS 与 BFS 的 按 层 
来 遍历 所 有 结 点 不 同 ， DFS 是 在 某 一 条 路 径 上 一 直 进 行 搜索 , 直到 这 条 路 径 走 不 通 ， 再 
换 一 条 路 径 进行 尝试 。19 世纪 的 一 位 法 国 数学 家 Charles Pierre Trémaux 在 研究 迷宫 问 
题 时 第 一 个 提出 了 DFS 算法 。 

根据 DFS 遍历 图 的 过 程 , 非常 类 似 于 在 一 个 迷宫 
里 面 寻 找 出 口 。 当 身 处 一 个 迷宫 , 我 们 总 是 沿 着 某 个 
路 径 进行 尝试 , 直到 这 条 路 径 上 要 么 存在 出 口 ， 要 么 
确定 走 不 通 , 然后 再 从 另外 一 条 路 径 继 续 进行 尝试 , 如 
图 7.7 所 示 。 图 7.7 中 的 起 点 为 s， 实 线 为 当前 尝试 的 
路 径 ， 虚 线 为 确定 该 路 线 走 不 通 后 ， 回 到 另外 一 个 结 
点 重新 开始 探索 新 的 路 径 。 

DFS 与 BFS 一 样 , 都 需要 不 重复 不 遗漏 的 遍历 图 图 7.7 走 迷 宫 与 DES 
中 所 有 结 点 。DFS 是 按照 深度 方向 一 直 遍 历经 过 的 结 
点 , 然后 回溯 到 最 近 的 还 有 分 支 的 结 点 继续 往 深 度 方向 遍历 。 以 图 7.8 为 例 , 按照 深度 方 
向 依次 遍历 了 结 点 1，2,，3, 4, 这 些 结 点 中 最 近 包 括 分 支 的 为 结 点 3。 因 此 ， 当 遍历 完结 
点 4 后 就 回溯 到 结 点 3, 再 从 结 点 3 开始 按 深度 方向 遍历 结 点 5 和 结 点 6。 











图 7.8 图 按照 DFS 遍历 示例 


7.5.1 ”深度 优先 搜索 算法 
为 了 实现 DFS 算法 , 首先 考虑 用 字典 parent 来 存储 DFS 的 结果 。 该 字典 的 key 
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就 是 图 中 的 每 一 个 结 点 ， 对 应 的 value 就 是 该 结 点 的 父 结 点 。 为 此 , 定义 一 个 包含 变量 
parent 的 DFSresult 类 ， 见 代码 7.9。 





代码 7.9 DFS 结果 类 





class DFSResult: 
def __init__(self): 
self .parent = {} 





如 果 给 定 的 图 只 有 一 个 起 始点 ， 那 么 可 以 设计 递归 函数 dfs_visit_r() 来 实现 
DFS ( 见 代码 7.10)。 该 函数 有 四 个 参数 , 分 别 是 输入 图 g, 起 始 结 点 v, DFS 的 输出 结果 
results, 结 点 v 的 父 结 点 parent。 由 于 初始 结 点 没有 父 结 点 , 因此 首先 设 parent=None。 

dfs_visit_r( ) 是 一 个 递归 函数 , 递归 的 条 件 是 判断 结 点 是 否 已 经 求 出 其 父 结 点 。 代 
码 7.10 第 3 行 的 循环 索引 所 有 与 结 点 v 连接 的 邻居 结 点 u， 如果 邻居 结 点 还 没有 父 结 
点 , 则 意味 着 该 邻居 结 点 还 未 被 遍历 , 于 是 经 由 第 5 行 的 递归 函数 遍历 结 点 u, 并 由 代码 
7.10 的 第 2 行将 结 点 v 记录 为 u 的 父 结 点 。 





代码 7.10 DFS 的 递归 实现 


def dfs_visit_r(g, Vv, results, parent=None): 
results.parent [v] = parent 
for u in g.adj[v]: 
if u not in results.parent: # 结 点 uu 还 未 遍历 到 
dfs_visit_r(g, u, results, v) # 递归 


当 图 存在 多 个 初始 结 点 时 , 那么 就 需要 设计 函数 循环 遍历 图 g 中 的 所 有 结 点 。 结 点 
目前 还 没有 在 parent 的 key 中 , 那么 就 调用 递归 函数 dfs_visit_r( )。 也 就 是 说 ， 如 果 图 
中 结 点 没有 父 结 点 , 执行 dfs_visit_r()。 函 数 dfs 的 实现 见 代码 7.11。 


代码 7.11 DFS 主 函数 








def dfs(g): 
results = DFSResult () 
for v in g.adj.keys(): 
if v not in results.parent: 
dfs_visit_r(E，V，Tesults) 


return results 





下 面 以 图 7.9 为 例 , 分 析 DFS 算法 的 执行 流程 。 算法 DFS 会 依次 遍历 结 点 
a, b, e, d, c, fs。 算法 开始 执行 后 , 由 于 结 点 a 目前 还 没有 父 结 点 , 因此 调用 递归 函数 
dfs_visit_r(g, a, results)。 代 码 7.10 第 2 行将 结 点 a 的 父 结 点 设 为 None。 然后, 循环 结 
点 a 的 所 有 邻居 结 点 b, d。 结 点 b 没有 父 结 点 , 递归 调用 函数 dfs_visit_r( ), 也 就 是 遍 
历 到 结 点 b, 并 将 a 记录 为 b 的 父 结 点 。 再 依次 遍历 到 结 点 @ 和 d。 








1 
六 
要 
a 
5 
6 
党 
8 
9 
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需要 注意 的 是 , 当 人 遍历 到 结 点 d 时 , 其 邻居 结 点 为 b。 但 是 结 点 b 已 经 存在 父 结 点 ， 
因此 并 不 会 从 d 结 点 再 继续 遍历 下 去 。 此 外 , 由 于 结 点 e 和 b 只 有 一 个 邻居 ， 且 它们 都 
已 经 遍历 , 同时 结 点 d 也 已 经 遍历 。 根 据 代码 7.11 第 4 行 的 条 件 , 会 选择 目前 还 没有 父 
结 点 的 结 点 e 进行 遍历 。 图 7.9 中 边 的 数字 表示 按照 DFS 算法 执行 的 顺序 ,虚线 表示 遍 
历 过 的 边 。 即 首先 遍历 结 点 a, 然后 分 别 遍历 结 点 b, e, d, c 和 f。 结 点 b 的 父 结 点 为 结 
点 a, 结 点 e 的 父 结 点 为 结 点 b, d 的 父 结 点 为 结 点 e, f 的 父 结 点 为 结 点 b。 








图 7.9 DEFS 示例 


代码 7.10 的 递归 函数 也 可 以 用 循环 来 实现 , 这 时 需要 使 用 一 个 叫 作 堆栈 (Stack) 的 
数据 结构 。 堆 栈 的 两 个 基本 操作 就 是 压 入 和 弹出 , 在 压 入 数据 时 遵循 先后 关系 , 也 就 是 
先 来 的 数据 先进 。 堆栈 的 弹出 数据 则 按照 “后 进 先 出 ”原则 。 大 家 可 以 把 堆栈 想象 成 只 有 

-个 开口 的 瓶子 ,数据 从 瓶 口 进出 。 

DFS 遍历 所 有 图 中 结 点 时 ， 如 果 某 条 路 径 下 的 结 点 全 部 遍历 完 ， 则 可 以 通过 堆栈 来 

存储 从 哪 一 个 结 点 开始 重新 寻找 新 的 路 径 。 利 用 堆栈 实现 的 DFS 见 代码 7.12。 


代码 7.12 基于 堆栈 的 DFS 算法 实现 


def dfs_iterative(graph): 
results = DFSResult () 


for v in graph.adj.keys(): 
if v not in results.parent: 
results.parent[v] = None 
if V not in results.visited: 
stack = [v] 
while stack: 
u= stack.pop() 
if u not in results.visited: 
results.visited.append(u) 
for n in graph.adj[u]: 
if n not in results.visited: 
results.parent [n]=results.visited[-1] 
stack.extend(n) 


return results 
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仍然 以 图 7.9 为 例 , 我 们 可 以 画 出 代码 7.12 中 堆栈 内 元 素 变 化 情况 , 见 图 7.10。 初 
始 结 点 a 进 栈 , 结 点 a 出 栈 并 记录 为 已 访问 。 结 点 a 的 两 个 邻居 结 点 b 和 结 点 d 分 别 进 
栈 , 结 点 d 出 栈 并 记录 为 已 访问 。 结 点 d 的 邻居 结 点 b 进 栈 , 此 时 栈 内 的 结 点 为 两 个 b 
结 点 。 结 点 b 出 栈 且 记录 为 已 访问 , 结 点 b 的 邻居 结 点 e 进 栈 , e 结 点 出 栈 且 记录 为 已 
访问 。e 结 点 的 邻居 结 点 d 再 进 栈 , d 和 b 依次 出 栈 。 此 时 , 遍历 结 点 顺序 为 [a, d, b, e]。 
因此 , 不 难看 出 DFS 遍历 的 结果 并 不 唯一 。 


d b e 
a b b b 
Stac Stac| stack stack 











visited={} visited={a} visited={a,d} visited={ad,b} 
d 
b b 
Stack Stack Stack 
visited={a,d,b,e} visited={a,d,b,e} visited={a,d,b,e} 


图 7.10 基于 堆栈 的 DFS 实现 


7.5.2 ”DFS 算法 分 析 


DEFS 递归 实现 代码 7.10 和 代码 7.11 有 两 个 函数 。 其 中 dfs_visit_r() 会 访问 一 次 结 
点 v 以 及 与 该 结 点 相连 结 的 相 邻 结 点 , 也 就 是 该 函数 的 时 间 复杂 度 为 O(||)。 此外, 另 
一 个 函数 dfs( ) 是 外 循环 , 它 会 遍历 每 一 个 结 点 ，dfs( ) 函数 的 时 间 复 杂 度 为 O(|V|)。 因 
此 , DFS 总 的 时 间 复 杂 度 为 O(|V| 十 |B|), 与 BFS 一 样 均 为 线性 时 间 复 杂 度 。 


7.5.3 ”DFS 应 用 举例 


7.5.3.1 “拓扑 排序 

拓扑 排序 是 将 有 向 图 G=(V, E) 中 的 顶点 以 线性 方式 进行 排序 。 即 对 于 任何 连接 自 
结 点 ue V 到 结 点 ve V 的 有 向 边 (u, we 卫 , 在 最 后 的 排序 结果 中 , 结 点 总 是 在 结 点 
v 的 前 面 。 

如 果 这 个 概念 还 略 显 抽象 的 话 , 那么 不 妨 考 虑 一 个 常见 的 例子 一 一 选课 。 如果 需 要 
学 习 算 法 设计 与 分 析 , 则 必须 有 一 些 先 选课 ， 比 如 数据 结构 、 离 散 数学 和 程序 设计 基础 
等 。 因此 , 在 拿 到 学 校 的 课程 列表 时 , 你 需要 按照 一 定 的 顺序 选择 课程 。 比 如 应 该 在 第 一 
学 期 修 程序 设计 基础 、 离 散 数学 , 在 第 二 学 期 修 数据 结构 , 而 在 第 三 学 期 修 算法 设计 与 
分 析 课程 。 这 样 才能 保证 在 学 习 过 程 中 , 不 会 存在 知识 脱节 的 问题 。 将 每 一 门 课程 对 应 
图 中 的 一 个 结 点 ， 结 点 之 间 的 边 表示 课程 的 依赖 关系 。 以 上 选课 中 所 考虑 的 先 选 或 者 后 
选 过 程 ， 就 是 拓扑 排序 。 
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代码 7.13 拓扑 排序 





def dfs_visit(g, v, results, parent=None): 
results.parent[v] = parent 
for n in g.adj[v]: 
if n not in results.parent: 
dfs_visit(g, n, results, v) 


results.order .append(v) 


def topological_sort(g): 
dfs_result = dfs(g) 
dfs_result .order .reverse() 
return dfs_result.order 


我 们 可 以 利用 DFS 来 实现 拓扑 排序 。 其 算法 非常 简单 , 就 是 在 DFS 所 遍历 结 点 顺 
序 的 基础 上 ,对 其 进行 反 序 操作 即 可 得 到 拓扑 排序 的 结果 ， 见 代码 7.13。 算 法 的 关键 是 
在 dfs_visit( ) 函数 的 最 后 将 顶点 v 添加 到 列表 order 中 , 这 样 就 能 保证 这 个 集合 就 是 拓 
扑 排序 的 结果 。 这 是 因为 添加 顶点 到 集合 中 的 时 机 是 在 dfs_visit( ) 函数 即将 退出 之 时 ， 
而 dfs_visit( ) 函数 本 身 是 个 递归 函数 , 只 要 当前 顶点 还 存在 边 指 向 其 他 任何 顶点 , 它 就 
会 递归 调用 dfs_visit( ) 函数 , 而 不 会 退出 。 因此 , 退出 dfs_visit() 函数 , 意味 着 当前 顶 
点 没有 指向 其 他 项 点 的 边 了 , 即 当 前 顶点 是 一 条 路 径 上 的 最 后 一 个 顶点 。 

可 以 简单 证 明 以 上 算法 总 能 获得 正确 的 拓扑 排序 结果 。 让 我 们 考虑 某 一 时 刻 结 点 
已 经 由 dfs_visit( ) 函数 调用 , 图 中 存在 一 条 边 到 结 点 v。 那 么 这 种 情况 下 , 存在 以 下 三 
种 可 能 : 


。 如 果 结 点 v 已 经 完成 , 显然 结 点 u 会 在 结 点 v 之 后 完成 
。 如 果 结 点 v 还 没 开始 , 这 意味 着 该 结 点 会 在 结 点 u 完成 之 后 被 调用 , 因此 结 点 v 





会 在 结 点 u 之 前 完成 
。 如 果 结 点 v 开始 但 还 没完 成 , 这 意味 着 存在 一 条 从 结 点 v 到 u 的 路 径 , 这 意味 着 
输入 图 存在 环 
如 果 假 定 输入 的 图 不 存在 环 ,也 就 是 第 三 种 情况 不 会 发 生 。 这样 总 能 保证 结 点 u 在 
结 点 v 之 后 完成 , 也 就 保证 了 拓扑 排序 的 结果 。 代码 7.13 第 9 行 的 函数 dfs( ) 实现 见 代 
码 7.11。 


7.5.3.2 ”判断 图 中 是 否 存在 环 

是 不 是 所 有 的 有 向 图 都 能 够 被 拓扑 排序 呢 ? 显然 不 是 。 继 续 考虑 上 面 的 例子 ， 如 
果 选 修 算 法 分 析 这 门 课 之 前 需要 学 习 程 序 设计 ， 而 选修 数据 结构 前 又 要 求 选 修 算法 分 
析 ， 选 修 程序 设计 之 前 则 要 去 选修 数据 结构 。 在 这 种 情况 下 ， 就 无 法 进行 拓扑 排序 ， 因 
为 各 课程 间 存在 互相 依赖 的 关系 ,从 而 无 法 确定 谁 先 谁 后 。 在 有 向 图 中 , 这 种 情况 意味 
着 图 存在 环 路 。 因 此 ,一 个 有 向 图 能 进行 拓扑 排序 的 充 要 条 件 就 是 它 是 一 个 有 向 无 环 
图 (Directed Acyclic Graph, DAG) 。 
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那么 该 如 何 判 断 有 向 图 中 是 否 存在 环 呢 ? 这 个 问题 依然 可 以 根据 DFS 来 进行 求解 。 
为 此 , 可 以 先 对 图 中 的 边 进行 分 类 , 将 图 中 的 边 按照 连接 关系 分 为 两 类 : 树 边 和 回 向 边 。 
按照 DFS 遍历 各 个 结 点 的 过 程 , 如 果 一 个 结 点 存在 父 结 点 , 那么 从 该 结 点 的 父 结 点 到 该 
结 点 的 边 就 是 树 边 。 如 图 7.9 所 示 ，(a, b)，(b, e)，(e, d) 都 是 树 边 。 在 构成 树 边 的 结 点 
中 ,如 果 某 个 结 点 有 到 其 祖先 结 点 的 边 , 则 称 该 边 为 回 向 边 。 按 照 DFS 算法 , d 结 点 来 
自 e, e 结 点 来 自 b, 而 b 结 点 来 自 a。 所 以 , a, b, e 这 三 个 结 点 都 是 d 结 点 到 祖先 结 点 。 
当 存 在 结 点 d 到 其 中 的 一 个 祖先 结 点 b 的 连接 , 因此 (d, b) 是 回 向 边 。 

在 按照 代码 7.10 执行 DFS 时 , 树 边 只 需 按 照 其 中 的 parent 进行 索引 就 可 以 得 到 。 
当 回 边 则 需 用 一 个 栈 来 存储 已 经 访问 过 的 结 点 ， 当 判断 当前 结 点 是 否 有 回 边 时 ， 需 要 依 
次 判断 当前 结 点 与 栈 中 存储 的 结 点 是 否 存 在 边 即 可 。 有 了 对 边 的 分 类 , 就 可 以 很 容易 判 
断 一 个 有 向 图 中 是 否 存在 环 。 其 判断 准则 就 是 , 如 果 该 图 存在 回 边 , 那么 图 中 一 定 有 环 。 





7.6 ”小 结 


图 由 结 点 集合 与 边 集合 构成 ， 当 赋予 图 结 点 特定 含义 时 , 图 将 成 为 重要 的 建 模 工具 。 
比如 将 结 点 看 作 神 经 元 , 边 看 作 神 经 元 之 间 连 接 的 突 触 , 那么 图 可 以 用 于 构建 神经 网 络 
模型 。 当 图 中 结 点 看 作 是 随机 变量 , 边 看 作 随 机 变量 之 间 的 依赖 关系 ,那么 图 就 成 为 了 
概率 图 模型 (Probability Graph Model)。 

图 的 应 用 中 最 为 常见 的 算法 就 是 遍历 图 中 的 每 一 个 结 点 ,要求 不 重复 、 不 遗漏 。 本 
章 主要 介绍 了 两 类 重要 的 遍历 算法 , BFS 和 DFS。BFS 是 按照 图 的 层次 进行 遍历 ,而 
DFS 则 是 先 将 某 个 结 点 所 有 能 到 的 路 径 上 的 点 遍历 , 然后 再 返回 最 近 的 有 其 他 路 径 的 
结 点 进行 遍历 。BFS 常常 用 于 寻找 图 上 最 短路 径 , 而 DFS 则 在 策略 寻找 中 有 重要 应 
用 。BFS 和 DFS 除了 应 用 于 本 章 的 问题 外 , DFS 还 常用 于 回溯 算法 , 而 BFS 则 在 分 支 
界限 算法 中 有 重要 的 应 用 。 


课 后 习题 


习题 7-1 ”图 的 存储 
序列 A=[1, 2, 3, 4, 5, 6, 7]， 
(a) 序列 A 按照 堆 结构 组 织 其 中 的 元 素 , 画 出 对 应 的 完全 二 又 树 。 
(b) 利用 邻接 列表 存储 以 上 完全 二 又 树 , 画 出 邻接 列表 的 结构 。 
(c) 利用 二 维 数组 存储 以 上 完全 二 叉 树 , 画 出 对 应 矩阵 的 结构 。 
(d) 设计 一 个 函数 , 计算 堆 A 对 应 的 完全 二 叉 树 中 每 一 个 结 点 的 出 度 与 入 度 。 


习题 7-2 ”好 人 对 坏人 


我 们 将 职业 摔跤 手 分 成 两 类 , 即 “ 好 人 ”和 “坏人 ”。 任 意 一 对 摔跤 手 可 能 是 对 手 ， 
也 可 能 不 是 对 手 。 假定 有 mn 个 摔跤 手 ， 其 中 7 对 彼此 是 对 手 。 现 需要 设计 一 个 复杂 度 
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为 O(n 十 7) 的 算法 , 将 这 nn 个 摔跤 手 分 别 赋予 “好 人 ”或 者 “坏人 ”的 角色 。 要 求 必 须 
是 “好 人 ”与 “坏人 ” 间 才 能 成 为 相互 的 对 手 。 
习题 7-3 ”判断 环 是 否 存在 

本 章 我 们 介绍 通过 DFS 可 以 在 有 向 图 中 确定 是 否 存在 环 。 现 给 定 一 个 无 向 图 
G=(V, 了 ), 给 出 一 个 复杂 度 为 O(|V|) 的 算法 , 确定 G 中 是 否 包 含有 环 。 
习题 7-4 ”遍历 每 一 条 边 

现 给 定 一 个 联通 无 向 图 G=(V, E), 给 出 一 个 复杂 度 为 O(|E 十 V|) 的 算法 , 遍历 G 
中 每 条 边 , 要 求 每 一 条 边 只 能 遍历 一 次 。 
习题 7-5” 字 梯 问 题 

给 定 两 个 单词 (start, end) 和 一 个 字典 , 要 求 找 出 从 单词 start 变化 到 end 的 最 小 序 
列 。 变化 过 程 中 出 现 的 中 间 单 词 必须 是 字典 中 有 的 单词 , 且 每 次 只 能 是 变化 其 中 的 一 个 

比如 start="hit", end="cog", dict = ["hot", "dot", "dog", "lot", "log"]。 那 么 从 
start 变化 到 end 经 过 了 5 步 , 即 "hit" 一 "hot" 一 "dot" 一 "dog" 一 "cog"。 





本 章 学 习 目 标 
。 了解 贪 心算 法 求解 优化 问题 的 过 程 
。 掌握 利用 贪心 算法 求解 典型 的 计算 问题 , 并 分 析 其 时 间 复 杂 度 
。 掌握 贪心 算法 在 单 源 最 短路 径 和 最 小 生成 树 中 的 应 用 





8.1 引言 


贪心 算法 (Greedy Algorithm) 是 指 在 求解 目标 问题 的 若干 步骤 中 , 每 一 步 总 是 作 
出 在 当前 看 来 是 最 好 的 选择 ， 以 期 望 获得 问题 的 全 局 最 优 解 。 尽 管 有 些 书 也 称 这 一 算法 
为 仿 禁 算法 , 但 它 与 我 们 所 知 的 形容 贪 禁 的 成 语 ,如 “贪得无厌 ”的 意思 不 尽 相 同 。 贪 心 
算法 之 所 以 “ 贪 ”， 是 因 它 只 考虑 了 当前 状况 下 的 得 失 , 可 能 产生 “贪小 失 大 ”或 者 “ 拾 
芝麻 而 丢 西 瓜 ”的 结果 。 

贪心 算法 的 目标 是 要 获得 问题 的 最 优 解 , 为 此 在 每 一 步 总 是 选择 当前 情况 下 的 最 优 
策略 。 它 与 分 治 算法 类 似 , 都 会 把 求解 的 问题 划分 成 若干 个 小 问题 , 每 个 小 问题 利用 贪 
心 策略 求 得 其 最 优 解 , 再 组 合 这 些小 问题 的 最 优 解 便 能 得 到 原 问 题 的 解 。 利 用 贪心 策略 
获得 的 解 并 非 一 定 不 是 最 优 解 ， 这 与 问题 和 使 用 的 贪心 策略 密切 相关 。 也 就 是 说 , 同样 
都 是 贪心 的 原理 , 但 其 策略 可 能 并 不 相同 。 是 否 能 获得 最 优 解 , 需要 通过 证 明 才 能 确定 。 

本 章 将 从 较 简 单 的 优化 问题 ， 如 硬币 找 零 、 间 隔 任务 规划 到 较为 复杂 的 优化 问题 ， 
如 单 源 最 短路 径 和 最 小 生成 树 等 出 发 ， 向 读者 介绍 设计 贪心 策略 ， 以 及 证 明 贪心 策略 获 
得 最 优 解 的 常用 方法 。 此 外 , 读者 还 将 学 习 到 堆 ( 见 5.4 节 ) 这 一 数据 结构 在 算法 性 能 优 
化 中 的 应 用 。 


8.2 ”硬币 找 零 


8.2.1 ”问题 描述 


假如 某 种 货币 的 硬币 有 如 下 几 种 面值 : 1 元 、5 元 、10 元 、25 元 和 100 元 , 且 数 量 
不 限 。 如 果 给 定 需 为 某 客 户 找 零 的 数额 amount_rem, 那么 如 何 组 合 该 货币 的 几 种 面值 ， 
从 而 使 得 客户 所 得 找 零 的 张 数 最 少 。 


om ao na nw nr- 
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比如 给 客户 找 零 的 数额 为 36 元 , 那么 可 以 给 客户 3 张 零钱 , 即 : 25 元 +10 元 十 1 
元 。 当然 , 也 可 以 给 客户 3 张 10 元 的 和 6 张 1 元 , 共 9 张 零钱 。 该 问题 要 求 找 给 客户 的 
零钱 数 的 总 数 必须 等 于 36 元 ， 同 时 找 零 的 货币 张 数 最 少 。 





8.2.2 ”问题 求解 


首先 ,考虑 将 给 客户 按照 指定 数额 amout_rem 进行 找 零 这 一 问题 分 解 成 若干 小 问 
题 , 每 个 小 问题 对 应 着 选择 一 张 可 能 的 面值 , 经 过 若干 次 选择 后 ， 所 选择 的 面值 总 额 等 
于 amout_rem。 因 此 , 硬币 找 零 这 一 问题 的 子 问题 就 是 在 每 次 选择 后 ， 完 成 剩余 数额 的 
找 零 。 其 次 , 根据 子 问题 ， 设 计 贪心 策略 进行 求解 。 由 于 面值 的 多 样 性 ,因此 必然 存在 多 
种 可 能 的 选择 。 一 个 简单 的 贪心 策略 就 是 从 所 有 满足 条 件 的 零钱 中 , 选取 面值 最 大 的 那 
张 作 为 找 零 。 最 后 , 对 于 所 有 的 子 问 题 , 均 采 用 同样 的 贪心 策略 , 直到 找 零 的 累加 值 等 于 
指定 数额 amout_rem 。 

以 客户 找 零 的 数额 为 36 元 这 一 问题 为 例 。 第 一 步 , amout_rem=36, 那么 除 100 元 
外 ,其 他 的 面值 都 是 可 选 的 找 零 面值 。 按 照 贪 心 策略 ， 应 该 选择 可 选 的 面值 中 最 大 的 
25 元 作为 第 一 步 的 找 零 面值 。 第 二 步 ， 由 于 已 经 找 给 客户 25 元 , 现在 的 amout_rem= 
36 一 25 = 11 元 ,同样 按照 贪心 策略 ， 这 一 步 可 选 面值 最 大 的 零钱 是 10 元 。 同 理 , 第 三 
步 可 选 面值 最 大 的 零钱 是 1 元 。 因 此 , 不 难得 到 找 零 的 面值 依次 为 [25,10,1]， 其 实现 见 
代码 8.1。 











代码 8.1 硬币 找 零 的 贪心 算法 


def get_min_ coins(amount_rem): 
coin_combinations = [1,5,10,25,100] 
coin list = [] 

# 从 大 到 小 排序 
sorted_coin_combinations = sorted(coin_ combinations,reverse=True) 
for coin val in sorted coin combinations: 

coin_count = int(amount_rem/coin_val) # 面值 个 数 
coin _ list += [coin val, ]* coin count # 将 面值 coin_val， 张 数 coin_count 
一 ”的 添加 到 输出 列表 
amount_rem -= coin val * coin_ count # 计算 剩余 额度 
if amount_rem <= 0.0: # 跳出 循环 条 件 
break 


return coin_list 





代码 8.1 第 5 行 通过 调用 Python 的 排序 函数 sorted 将 零钱 的 面值 进行 排序 ,其 
中 函数 的 参数 reverse 置 为 True 是 为 了 实现 从 大 到 小 的 排序 。 如 果 reverse 没有 赋 
值 ， sorted 返回 的 将 是 从 小 到 大 的 序列 。 为 了 找 出 与 输入 额度 amount_rem 最 接近 的 零 
钱 , 第 7 行 通过 整除 的 方法 求 得 面值 coin_val 的 张 数 为 coin_count, 第 8 行 的 代码 将 面 
值 与 张 数 添加 到 输出 列表 coin_list 中 。 在 成 功 添加 零钱 后 , 第 9 行 实现 的 功能 是 将 原来 
的 额度 减 去 添加 零钱 的 总 数 ,， 即 得 到 下 一 个 子 问题 。 
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代码 8.1 执行 时 间 包括 两 个 部 分 : 第 一 部 分 是 对 输入 零钱 的 排序 ， 其 时 间 复 杂 度 为 


O(nlogn); 另 一 部 分 是 第 6 行 ~ 11 行 的 循环 ,执行 时 间 复 杂 度 为 O(n)。 因 此 , 代码 8.1 
中 函数 get_min_coins( ) 的 时 间 复 杂 度 为 O(nlog n)。 


8.2.3 ”最 优 解 证 明 


如 代码 8.1 所 示 , 在 每 一 步 选择 面值 与 当前 找 零 最 接近 的 硬币 这 一 贪心 策略 ， 可 以 


获得 输入 额度 的 找 零 结果 。 然 而 , 这 一 找 零 结 果 是 否 就 能 获得 最 小 的 找 零 数 并 非 不 证 自 


明 。 


因此 ,下 面 我 们 将 证 明 采 用 以 上 贪心 策略 可 求 得 硬币 找 零 问题 的 最 优 解 。 
我 们 得 到 选择 的 1 元 硬币 个 数 小 于 等 于 4。 这 个 结论 之 所 以 成 立 , 是 因为 如 果 1 元 


硬币 超过 4 个 , 就 可 以 用 5 元 硬币 来 替换 其 中 的 5 个 1 元 硬币 。 


Cko 


类 似 的 还 可 以 得 到 如 下 结论 : 

。 选择 的 5 元 硬币 个 数 小 于 等 于 1 

。 选择 的 25 元 硬币 个 数 小 于 等 于 3 

。 选择 的 5 元 硬币 加 上 10 元 硬币 个 数 小 于 等 于 3 

有 了 以 上 结论 后 ,下 面 就 可 以 证 明 按 贪心 策略 可 求 得 硬币 找 零 问题 的 最 优 解 。 

假定 需要 找 零 的 数量 为 r, 如 果 有 ck < x < ck+1, 那么 贪心 策略 要 求 必须 选择 硬币 
可 以 证 明 任何 优化 解 都 必须 包括 硬币 cx， 和 否则 意味 着 需要 从 硬币 c1,… ,ck_1 中 选 


择 硬币 ， 使 得 它们 累加 和 达到 z。 从 以 上 结论 我 们 可 以 得 到 以 下 结果 : 


。 如 果 cj 是 5 元 硬币 , 那么 由 硬币 c1,… ,cr_1 组 合 的 累加 最 大 值 为 4; 

。 如 果 cx 是 10 元 硬币 , 那么 由 硬币 c1,… ,ck_1 组 合 的 累加 最 大 值 为 9, 这 是 因为 
最 多 只 能 包含 4 个 1 元 硬币 , 以 及 1 个 5 元 的 硬币 ; 

。 如 果 cx 是 25 元 硬币 , 那么 由 硬币 c1,… ,ck-1 组 合 的 累加 最 大 值 为 24, 这 是 因 
为 最 多 只 能 包含 4 个 1 元 硬币 , 以 及 2 个 10 元 的 硬币 ; 

。 如 果 cx 是 100 元 硬币 , 那么 由 硬币 c1,…… ,ck_1 组 合 的 累加 最 大 值 为 99, 这 是 因 
为 最 多 只 能 包含 3 个 25 元 硬币 ,其 他 面值 累加 和 为 24。 


以 上 结果 表明 从 c1,… ,ck-1 中 选择 硬币 其 累加 和 小 于 ck， 因 此 必须 选择 硬币 ck。 





8.3 间隔 任务 规划 


8.3.1 ”问题 描述 


假如 你 现在 参加 某 个 国际 学 术 会 议 , 会 议 中 有 许多 来 自 世 界 各 地 的 科学 家 作 报 告 ， 


你 的 任务 是 听 尽 可 能 多 的 报告 。 于 是 从 会 议 组 织 者 拿 到 了 会 议 日 程 表 , 发现 每 一 个 科学 
家 的 报告 主题 各 不 相同 , 而 且 他 们 报告 的 开始 与 结束 时 间 也 各 不 一 样 。 那么 你 该 如 何 选 
择 听 哪些 报告 ， 从 而 使 得 你 能 听 的 报告 数 最 多 呢 ? 


分 析 以 上 问题 , 不 难得 到 给 定 的 输入 应 该 是 n 个 报告 集 R=[r1, …, ra]， 以 及 每 一 
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个 报告 的 开始 与 结束 时 间 zr;=[ai, ba]。 由 于 报告 起 始 时 间 有 交错 , 而 你 不 能 一 次 参加 两 个 
报告 。 因此 , 选择 的 报告 集合 里 面 , 报告 时 间 都 必须 相 容 。 相 容 意味 着 两 个 报告 的 发 生 时 
间 里 面 没 有 重合 , 或 者 说 一 个 报告 开始 时 间 需 要 大 于 另 一 个 报告 的 结束 时 间 。 这 样 保证 
每 个 选择 的 报告 都 能 参加 ， 且 能 完整 地 听 完 报告 。 问题 的 输出 就 是 , 选择 最 大 的 相 容 报 
告 集 。 
如 图 8.1 所 示 , 我 们 用 一 条 线段 来 表示 每 一 个 任务 , 这 样 可 以 清楚 的 表示 每 一 个 报 
告 的 起 始 时 间 关系 。 图 8.1 中 mi 与 r 就 是 两 个 不 相 容 的 报告 ,ra 的 开始 时 间 小 于 ma 的 
结束 时 间 。ra 和 rs 则 是 两 个 相 容 的 报告 , rs 的 开始 时 间 大 于 ra 的 开始 时 间 。 选 择 最 大 
的 相 容 报告 集 就 是 图 中 的 椭圆 所 包括 的 3 个 报告 集合 ，[rs, re, r7]。 




















图 8.1 任务 规划 示例 


8.3.2 ”问题 求解 


对 于 给 定 的 nn 个 报告 集 R, 我 们 尝试 使 用 贪心 算法 来 选择 其 中 的 各 个 报告 。 贪心 算 
法 本 身 非常 简单 , 就 是 对 当前 子 问题 选择 当前 认为 最 好 的 报告 , 也 就 是 : 

(1) 按照 贪心 策略 选择 目前 最 好 的 一 个 报告 mi; 

(2) 删除 R 中 的 x, 以 及 与 x 不 相 容 的 其 他 报告 ; 

(3) 在 剩余 的 报告 中 重复 步骤 (1)。 

以 上 算法 的 第 一 步 中 , 我 们 没有 给 出 具体 的 贪心 策略 。 有 些 问 题 很 容易 确定 其 
贪心 策略 ， 比 如 硬币 找 零 问题 ， 就 是 尽量 选择 面额 大 的 硬币 。 然 而 ， 任 务 规划 问题 
的 贪心 策略 就 不 是 那么 容易 确定 ， 因 为 存在 多 个 可 能 的 贪心 策略 ， 可 能 的 贪心 策 
略 有 : 

(1) 选择 开始 时 间 最 早 的 报告 ; 

(2) 选择 间隔 时 间 最 短 的 报告 ; 

(3) 选择 冲突 最 少 的 报告 ; 

(4) 选择 结束 最 早 的 报告 。 

我 们 逐个 分 析 以 上 贪心 策略 ,发 现 有 些 策略 并 不 能 保证 获得 最 优 解 。 比 如 , 选择 当 
前 开始 时 间 最 早 的 报告 , 按照 这 个 策略 应 该 选择 图 8.2 中 第 一 行 的 报告 ， 因 为 该 报告 在 
这 三 个 报告 中 开始 时 间 最 早 , 但 显然 选择 这 个 报告 并 非 最 优 解 。 图 8.2 中 应 该 选择 第 二 
行 的 两 个 报告 。 
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第 二 个 贪心 策略 的 反例 见 图 8.3, 选择 最 短 时 间 间 隔 意 味 着 选择 第 二 行 的 报告 , 同样 
按 该 策略 并 不 能 得 到 最 优 解 ， 而 应 该 选择 第 一 行 的 两 个 报告 。 











下 
图 8.2 贪心 策略 1 的 反例 图 8.3 贪心 策略 2 的 反例 


如 图 8.4 所 示 的 是 第 三 个 贪心 策略 的 反例 ,当前 冲突 最 少 的 是 图 中 第 二 行 中 间 的 报 
告 。 然而 , 最 优选 择 应 该 是 第 一 行 的 4 个 报告 , 尽管 它们 的 冲突 比 第 二 行 中 间 的 报告 多 。 

















下 一 
一 
一 


图 8.4 贪心 策略 3 的 反例 


以 上 三 个 贪心 策略 的 反例 ， 都 可 以 通过 第 四 个 贪心 策略 得 到 正确 的 解 , 也 就 是 应 该 
选择 当前 结束 最 早 的 那个 报告 。 直 观 来 看 , 选择 结束 时 间 最 早 的 报告 是 为 了 空 出 更 多 的 
剩余 时 间 , 这 样 可 以 保证 后 面 能 选择 更 多 的 报告 。 

根据 第 四 个 贪心 策略 ， 我 们 可 以 得 到 如 代码 8.2 所 示 的 算法 。 代 码 第 4 行将 输入 
的 任务 按照 完成 时 间 进 行 排序 。 这 里 采用 Python 中 列表 的 排序 函数 sort。 其 中 , 采用 
lambda 表达 式 让 输出 按照 列表 中 第 2 位 元 素 的 大 小 进行 排序 ， 即 按照 完成 时 间 排 序 。 
参数 joblist 的 输入 是 形 如 [['e', 8, 10], ['b', 2, 5]] 的 列表 , 其 中 ['e', 8, 10] 表示 一 个 任 
务 , 'e' 表 示 任 务 代 号 , 8 表示 开始 时 间 , 10 为 任务 'e' 的 结束 时 间 。 

代码 8.2 第 11 行 选择 结束 最 早 的 任务 加 入 到 列表 job_schedule 中 。 在 决定 选择 之 
前 需要 判断 这 个 任务 与 job_schedule 中 最 近 的 任务 是 否 存在 冲突 ( 见 代码 8.2 第 10 行 )， 
也 就 是 新 加 入 的 任务 开始 时 间 需 要 大 于 job_schedule 中 最 近 任 务 的 结束 时 间 。 由 于 在 第 
4 行 对 输入 的 任务 集 按照 各 自 结束 时 间 进 行 了 排序 , 因此 初始 情况 下 , 直接 将 排序 后 的 
第 一 个 任务 加 入 到 列表 job_schedule 中 ( 见 代码 第 7 行 )。 


代码 8.2 间隔 任务 规划 的 贪心 算法 





def get_max_intervalschdeule(joblist) : 
job_schedule = [] 
num jobs = len(joblist) 
joblist.sort(key=lambda x: Xx[2]) # 按照 结束 时 间 对 所 有 的 job 排序 
for n in range(num jobs) : 
if not job_schedule: 
job_schedule.append(joblist[n]) 
else: 
# job(n) 是 否 与 job_schedule 中 的 jobs 相 容 


10 


11 


12 
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if job_schedule[-1] [2] <= joblist[n] [1] : 
job_schedule.append(joblist[n]) 


return job_schedule 





如 果 输 入 的 任务 集合 为 
joblist = [['e', 8, 10], ['b', 2, 引 ['e', 4, 7], [av 1, 3], ['d', 6, 9] 
那么 将 得 到 如 下 选择 任务 集合 
[av 1, 3], ['c', 4, 7], ['e', 8, 10]] 
代码 8.2 的 时 间 复 杂 度 包括 两 个 部 分 , 第 一 是 对 n 个 输入 任务 按照 其 结束 时 间 排 


序 , 其 时 间 复 杂 度 为 O(nlogn), 另 一 个 部 分 就 是 按照 结束 时 间 最 早 的 准则 选择 任务 , 其 
时 间 复 杂 度 为 O(n)。 因 此 , 代码 8.2 的 时 间 复 杂 度 为 O(nlogn)。 


8.3.3 ”最 优 解 证 明 
以 上 算法 正确 性 由 以 下 命题 保证 ,， 即 


命题 1 按照 选择 当前 结束 时 间 最 早报 告 的 贪心 策略 ， 可 以 获得 间隔 任务 规划 问题 
的 最 优 解 。 


假如 按照 以 上 贪心 策略 并 不 能 得 到 最 优 解 , 那么 意味 着 不 选择 最 早 结束 的 任务 可 以 
获得 比 贪心 策略 更 优 的 解 , 我 们 称 这 个 策略 为 优化 策略 。 假 如 按照 贪心 策略 , 已 经 选择 
了 任务 ii，…… , ir。 按照 优化 策略 选择 的 最 优 解 为 六 ,jo,… , jm。 不 妨 设 贪心 策略 与 优 
化 策略 选择 的 任务 最 多 有 r 项 是 一 样 的 , 也 就 是 计 = j,i2 = jp,… ,i 三方, 如 图 8.5 
所 示 的 “替换 前 ”。 











替换 前 h 
贪心 策略 wal 加 和 bt1 处 
优化 策略 六 廊 六 
替换 后 
贪心 策略 加 困 br 
优化 策略 所 廊 
个 


图 8.5 贪心 策略 可 获 优化 解 
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第 7 十 1 个 任务 贪心 策略 选择 的 是 ir1, 而 优化 策略 选择 的 是 ji1。 显然 , 任务 条 +1 
的 结束 时 间 比 ji+1 早 。 如 果 我 们 将 优化 策略 下 的 任务 方 +1 替换 为 i-41， 那么 依然 可 以 
得 到 替换 这 个 任务 后 ,任务 之 间 并 没有 冲突 ,如 图 8.5 所 示 的 “替换 后 ”。 这 说 明 优化 策 
略 与 贪心 策略 相同 的 任务 数 不 是 ", 与 我 们 的 假设 矛盾 。 这 表明 按照 贪心 策略 得 到 的 就 
是 最 优 解 。 


8.4 单 源 最 短路 径 问题 


自驾 游 是 现在 非常 流行 的 一 种 旅游 形态 , 主要 是 这 种 旅游 方式 的 个 性 化 和 灵活 性 让 
许多 人 趋 之 若 落 。 假 如 我 们 需要 从 杭州 自驾 车 去 北京 ,这 两 个 城市 之 间 还 有 许多 城市 值 
得 停留 。 我们 在 电子 地 图 软件 中 选择 出 发 地 点 为 杭州 ， 目的 地 为 北京 ， 限制 条 件 为 路 程 
最 短 。 电 子 地 图 软件 则 根据 选 定 的 出 发 地 与 目的 地 ,以 及 限制 条 件 , 为 我 们 规划 出 一 条 
从 杭州 到 北京 之 间 最 短 的 行程 ， 见 图 8.6。 





图 8.6 自驾 游 的 最 短路 径 


以 上 问题 的 输入 是 给 定 图 G=(V, E), 图 上 各 条 边 的 长 度 1。 > 0, 源 点 ss V。 输 出 为 
从 s 到 图 G 中 各 个 结 点 的 最 短路 径 。 这 里 需要 强调 的 是 假定 各 边 长 度 均 须 大 于 0, 且 从 
源 点 出 发 能 到 达 图 上 所 有 的 其 他 结 点 , 如 图 8.7 所 示 。 








图 8.7 单 源 最 短路 径 
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为 了 能 求 得 图 8.7 中 结 点 D 的 最 短路 径 d(D), d(D) 的 路 径 必定 经 过 结 点 DD 的 其 中 
一 个 前 驱 结 点 , 即 B 或 EE。 如 果 B 入 的 最 短路 径 已 经 求 得 , 分 别 为 d(B) 和 d(E), 那 
么 d(DD)=min(d(B)+1(B, D), d(E)+L(E, D))。 这 意味 着 在 求 最 短路 径 时 , 可 以 将 图 G 的 


结 点 分 解 为 两 个 部 分 , 一 个 部 分 是 已 经 求 出 最 短路 径 的 结 点 集合 , 另 一 部 分 则 是 还 未 求 
出 最 短路 径 的 结 点 集合 。 


不 妨 用 集合 S 存储 图 上 已 经 计算 出 最 短路 径 的 结 点 , 用 d(u) 表示 最 短路 径 的 值 , 其 
中 ue S。 显然 , 可 以 将 源 点 s 设 为 S 中 的 第 一 个 元 素 , 即 有 S=[s], d(s) = 0。 那么 当 逐 
步 扩展 集合 S, 直到 它 等 于 V, 就 意味 着 全 部 求 得 图 G 中 结 点 的 最 短路 径 。 下 面 将 介绍 
根据 贪心 策略 逐步 扩展 S 从 而 求 得 图 中 各 个 结 点 最 短路 径 的 Dijkstra 算法 。 


8.4.1 Dijkstra 算法 


Dijkstra 是 荷兰 计算 机 科学 家 , 他 由 于 在 设计 ALGOL60 语言 方面 的 杰出 成 就 , 获 
得 了 1972 年 的 图 灵 奖 。Dijkstra 算法 是 一 个 非常 典型 的 贪心 策略 的 应 用 , 它 的 基本 思 
想 是 : 

1. 维护 一 个 已 求 出 最 短 距离 的 集合 S; 

2. 选择 一 个 还 未 加 入 S 的 结 点 ve V-S, 加 入 到 集合 S 中 , 结 点 v 的 距离 值 cv 按 下 
式 计算 : 

cv = mins Ad) 于 下 (8.1) 
将 最 小 c, 值 对 应 的 结 点 v 加 入 到 S 后 , 置 d(v)=c。; 

3. 重复 执行 第 二 步 直 到 S 包含 了 图 中 所 有 结 点 。 

以 上 算法 的 第 二 步 即 为 贪心 策略 , 在 集合 V-S 中 选择 了 距离 值 最 小 的 结 点 加 入 到 
S。 但 是 , 我 们 能 确保 这 个 结 点 的 距离 值 已 经 是 最 小 ,而 不 会 在 后 面 的 计算 中 还 会 变 小 
吗 ? 此 外 , 在 计算 c 的 值 时 , 我 们 能 确定 这 个 值 会 随 着 算法 的 执行 会 逐渐 变 小 ， 并 最终 
等 于 该 结 点 的 距离 最 小 值 d(v) 吗 ? 

在 回答 以 上 两 个 问题 之 前 , 我 们 先 来 看 一 下 按照 Dijkstra 算法 如 何 计算 图 8.7 中 各 
点 的 最 小 距离 。 图 中 起 点 为 s, 初始 设 d(s)=0, S={s}。 与 结 点 s 连接 的 有 三 个 结 点 , 它们 
各 自 的 距离 值 分 别 为 0 十 16 = 16, 0 十 8 = 8, 0 十 4 = 4。 当前 最 小 值 为 4, 则 将 该 结 点 加 
入 到 S 中 , 得 S={s, A}。 现在 与 集合 S 中 两 个 结 点 相连 接 的 结 点 有 B 和 C, 计算 它们 各 
自 的 距离 值 ， 然 后 选择 距离 值 最 小 的 cc = 3 十 4 一 7 所 对 应 的 结 点 C 加 入 到 集合 S 中 。 

依 此 不 难得 到 剩余 各 个 结 点 的 最 短 距 离 值 ， 见 图 8.8。 其 中 , 阴影 部 分 涵盖 的 结 点 即 
为 集合 $ 中 的 各 个 结 点 , 求 出 的 各 个 结 点 最 短 距离 值 写 在 结 点 内 , 下划线 对 应 的 c。 就 是 
按照 贪心 策略 得 到 的 结 点 距离 值 。 

根据 以 上 计算 , 可 以 得 到 如 代码 8.3 所 示 的 Dijkstra 算法 伪 代 码 。 第 4 行 的 函数 
find_min( ) 的 功能 是 从 剩余 结 点 V-S 中 计算 各 个 与 S 结 点 中 相连 接 的 各 个 结 点 距离 值 ， 
并 返回 其 中 的 最 小 值 。 第 3 行 的 循环 在 集合 S 等 于 V 时 结束 , S 存储 所 有 已 经 求 得 最 小 
值 的 结 点 集 。 























136 算法 设计 与 分 析 (Python) 








图 8.8 Dijkstra 算法 示例 


代码 8.3 Dijkstra 算法 伪 代 码 


def dijkstra pseudo(G,s): 


s=[] # 用 于 存储 已 经 求 出 最 短 距离 的 结 点 
while S != V: # V 表 示 图 G 中 所 有 结 点 集 
clv) = find_min(V-S)  # 按照 贪心 策略 选择 结 点 v 
S.append(v) # 将 结 点 v 加 入 到 S 





8.4.2 ”算法 的 正确 性 


在 算法 设计 的 时 候 , 我 们 曾 对 从 剩余 结 点 集合 V-S 中 取出 最 小 的 加 入 到 $ 中 是 有 
疑问 的 。 因为 , 这 需要 保证 在 后 面 的 计算 中 这 个 加 入 到 S 中 的 结 点 距离 值 不 会 变 小 。 或 
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者 说 , 我 们 需要 证 明 在 集合 S 中 的 结 点 v, 其 距离 d(v) 一 定 是 从 源 点 s 到 该 点 的 最 小 距 
离 。 下 面 我 们 用 归纳 法 来 证 明 这 个 结论 的 正确 性 。 

算法 第 一 步 是 将 源 点 s 加 入 到 S,， 并 设 定 其 距离 d(s)=0。 显 然 这 一 步 的 结论 是 正确 
的 。 不 妨 设 当 S 中 有 大 个 结 点 时 ， 都 能 保证 当前 距离 都 是 从 源 点 s 到 这 上 大 个 结 点 的 距 
离 最 小 值 。 当 前 需 将 结 点 ve V-S 加 入 到 S, 结 点 v 与 $ 中 的 结 点 ue S 相互 连接 ,如 
图 8.9 所 示 。cu = d(u) + !(uv), 这 意味 着 与 结 点 v 连接 的 S 中 的 各 个 结 点 , 经 过 边 1(u， 
v) 的 是 最 小 距离 。 此 外 ， 当 将 结 点 v 加 入 S, 则 意味 着 当前 所 有 V-S 结 点 集合 的 距离 值 
中 , c, 是 最 小 的 。 























图 8.9 Dijkstra 算法 证 明示 意图 


不 妨 设 还 存在 另 一 条 从 源 点 s 到 v 的 最 小 路 径 P, 那么 这 条 路 径 上 必定 有 一 个 结 点 
y 不 属于 $, 并 假定 S 中 与 y 相连 的 最 后 一 个 结 点 为 x, xE S。 如 果 不 存在 这 样 的 结 点 y， 
则 意味 着 s 到 v 的 最 小 距离 就 是 d(v)。 路 径 P 的 长 度 !(P) 一 定 大 于 等 于 源 点 s 到 x 路 
径 长 度 L(P') 加 上 1(x, y)。 由 于 xe $, 根据 归纳 假设 d(x) 已 经 是 最 小 值 , 那么 有 1(P) > 
d(x)+l(x, y)。 

根据 c(y) 的 定义 有 d(x) 二 (x, y)> c(y)。 又 因为 选择 了 结 点 v 而 非 结 点 y 加 入 到 5S 
中 , 意味 着 c(y)> c(x)。 因 此 , 得 到 !(P)> c(v)。 意味 着 按照 Dijkstra 算法 选择 结 点 v 加 
入 到 s, 保证 了 v 是 最 小 距离 。 








8.4.3 ”算法 的 性 能 优化 


代码 8.3 描述 的 Dijkstra 算法 中 需要 根据 下 式 计算 结 点 ve V-S 的 距离 值 
人 (8.2) 


以 上 公式 要 求 每 次 循环 都 需要 更 新 集合 V-S 中 所 有 与 S 集合 中 结 点 相连 接 的 边 , 然 
后 依 此 求 得 各 个 结 点 的 c,， 再 取 其 中 最 小 值 。 这 一 步 计算 可 以 简化 , 即 只 保存 cv 当前 的 
最 小 值 。 具体 来 说 , 就 是 在 有 新 的 结 点 v 加 入 S 后 , 更 新 所 有 与 v 相连 接 结 点 u 的 距离 
值 , 即 : 


oem wu nn rn 
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c(u) = min{c(u), d(v) + Ll(u, v)} (8.3) 

根据 以 上 分 析 ， 可 以 将 代码 8.3 进行 优化 得 到 代码 8.4。 其 中 , 代码 8.4 第 4 行 

的 函数 extract-min( ) 是 从 集合 V-S 中 得 到 距离 值 最 小 的 结 点 w 然后 将 v 加 入 到 

集合 S， 并 通过 第 6 行 的 循环 更 新 所 有 与 v 连接 的 结 点 u 的 距离 值 。 这 里 , c(v) = 
min{c(w), d(v) + l(u, v)}.。 


代码 8.4 改进 的 Dijkstra 算法 伪 代 码 





def dijkstra_pseudo(G,s): 
s=[] # 用 于 存储 已 经 求 出 最 短 距离 的 结 点 
while S != V: # V 表示 图 G 中 所 有 结 点 集 
c(v) = extract_min(V-S) # 从 V-S 中 得 到 距离 值 最 小 结 点 v 
S.append(v) # 将 结 点 v 加 入 到 S 
for u in v.adj: # 对 与 V 相 连接 的 各 个 邻居 结 点 u 


if (a) > A(W + La Ty): # 只 记录 当前 最 小 值 
cl(u) = d(v) + 1(u, Vv) 


现在 我 们 对 代码 8.4 进行 时 间 复 杂 度 分 析 。 其 中 , 第 3 行 的 循环 次 数 为 O(n), 循 
环 内 第 4 行 是 得 到 序列 的 最 小 值 。 这 个 时 间 与 组 织 序列 的 结构 有 关 , 不 妨 设 该 时 间 为 
Tectract_min。 第 6 行 是 外 循环 的 一 个 内 循环 , 它 处 理 每 一 个 结 点 的 相 邻 结 点 。 如 果 与 外 循 
环 一 起 考虑 ， 就 是 计算 了 图 中 的 每 一 条 边 。 因 此 , 第 6 行 与 第 3 行 一 起 , 执行 的 次 数 就 
是 O(|B|), | 如 | 为 图 G 的 边 数 。 代 码 第 7 ~ 8 行 是 将 集合 V-S 中 结 点 u 的 距离 值 进行 更 
新 ,其 执行 效率 同样 与 集合 V-S 中 各 个 结 点 的 存储 结构 有 关 ， 设 该 时 间 为 Taecrease_key。 
因此 , 代码 8.4 总 的 执行 时 间 为 : 


T(dijkstra) = O(V) x Tactract_min + O(EB) x Tiscrense_ key (8.4) 


前 面 我 们 说 Toxtract_min 的 时 间 与 组 织 序列 的 结构 有 关 。 不 妨 假设 V-S 中 结 点 是 按 
照 列表 进行 组 织 , 那么 从 列表 中 查找 最 小 值 的 时 间 复 杂 度 是 列表 的 长 度 的 线性 时 间 , 而 
Taecrease_key 的 功能 是 修改 列表 中 的 一 个 数据 ,其 时 间 复 杂 度 为 常数 。 因此， 当 用 列表 存 
储 V-S 中 的 结 点 , 代码 8.4 所 示 的 Dijkstra 算法 时 间 复 杂 度 为 O(|V|?)。 

V-S 中 结 点 值 也 可 以 按照 堆 结构 ( 见 节 5.4) 进行 组 织 。 堆 可 以 保持 最 小 值 在 其 根 
部 , 那么 代码 8.4 中 函数 extract_min( ) 只 需要 直接 从 堆 中 取 根 结 点 即 可 , 而 不 需要 经 过 
查找 才 得 到 最 小 距离 值 ， 也 就 是 说 Txtract_min 是 常数 时 间 。 但 从 堆 上 删除 根 结 点 ,会 引 
起 堆 结构 变化 ,其 时 间 复 杂 度 为 O(log n), n 为 列表 中 元 素 个 数 。 

此 外 ,， 当 用 堆 结构 来 组 织 V-S 中 结 点 值 ，Taecrease_key 就 相当 于 执行 了 堆 化 〈 见 代 
码 5.13) 操作 , 即 改 变 的 结 点 值 会 引起 堆 结构 变化 , 但 其 时 间 复 杂 度 依然 是 O(log n)。 因 
此 , 用 基于 堆 结构 来 组 织 V-S 中 结 点 值 时 ,由 于 基于 堆 的 操作 , 不 管 是 从 队列 中 删除 一 
个 元 素 , 还 是 队列 中 元 素 值 发 生变 化 而 引起 的 队列 元 素 位 置 变化 ,其 时 间 复 杂 度 都 是 
O(logm) ( 见 5.4 节 )。 因 此 , 代码 8.4 所 示 的 Dijkstra 算法 使 用 堆 来 存储 V-S， 其 时 间 复 
杂 度 将 从 原来 的 O(|VI) 提高 到 O(|V|log |V1|)。 
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代码 8.4 并 未 给 出 一 个 完整 的 实现 ,下 面 我 们 利用 Python 自 带 的 堆 结 构 来 实现 Di- 
jkstra 算法 ， 见 代码 8.5。 代码 第 5 行将 原点 和 其 最 小 距离 值 0 添加 到 堆 priority_queue。 
第 7 行 的 循环 直到 堆 中 还 有 元 素 为 止 。 堆 的 操作 有 第 9 行 的 heappop() 和 第 18 行 的 
heappush( )， 分 别 是 从 得 到 堆 结构 根 结 点 和 添加 一 个 结 点 。 代 码 用 一 个 字典 结构 visited 
来 存储 每 一 个 结 点 的 最 小 距离 。 


代码 8.5 ”基于 堆 结 构 的 Dijkstra 算法 





import heapq 
def dijkstra(graph,source) : 
priority_queue = [] # 优先 队列 
c[source] = 0 
# 推 初始 化 
heapq.heappush (priority_queue, (0, source)) 
visited = {} # 存储 输出 结果 的 字典 结构 
while priority_queue: 
# 从 堆 中 获取 最 小 距离 结 点 
(current_distance, current) = heapq.heappop(priority_queue) 
if current not in visited: # 将 距离 值 添加 到 visited 
visited[current] = current_distance 
if current not in graph: continue 
# 更 新 与 current 相 邻 各 结 点 neighbour 的 distance 
for neighbour, distance in graph[current] .items(): 
if neighbour in visited: continue 
new_distance = current_distance + distance 
heapq.heappush (priority_queue, (new_distance, neighbour)) 


return visited 


需要 注意 的 是 , 代码 8.4 第 17 行 与 第 18 行 并 未 直接 更 新 结 点 的 值 , 而 是 直接 将 结 
点 neighbour 的 值 加 入 到 堆 priority_queue 中 。 这 意味 着 priority_queue 中 有 重复 的 结 
点 ,代码 8.4 通过 第 11 行 的 条 件 判断 来 控制 没有 重复 结 点 加 入 到 S 中 。 


8.5 ”最 小 生成 树 


一 家 网 络 公司 因 业 务 发 展 需要 , 需要 在 某 市 区 县 铺设 电缆 , 该 市 共有 10 个 区 县 。 铺 
设 的 电缆 需要 经 过 每 一 个 区 县 政府 所 在 地 ， 从 而 使 得 这 10 个 区 县 政府 之 间 都 可 以 进行 
通信 。 各 区 县 政府 之 间 存 在 多 个 通路 ， 由 于 各 个 通路 的 地 质 条 件 并 不 一 样 ， 导 致 各 通路 
的 铺设 成 本 也 各 不 一 样 。 现 在 要 求 寻找 一 条 联通 这 10 个 区 县 政府 , 且 铺 设 成 本 最 低 的 一 
种 铺设 方案 , 如 图 8.10 所 示 。 

以 上 问题 可 以 通过 构造 一 个 图 来 进行 建 模 。 每 一 个 区 县 政府 用 图 中 的 一 个 结 点 表示 ， 
结 点 之 间 的 边 表示 可 行 的 通路 ， 结 点 上 耦合 了 一 个 权重 值 W 来 表示 铺设 成 本 。 问 题 就 变 
为 给 定 有 向 图 G=(V, E, W), 求 图 上 的 最 小 生成 树 (Minimum Spanning Tree, MST)。 
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图 8.10 铺设 电费 与 最 小 生成 树 问 题 


MST 需要 满足 两 个 基本 条 件 。 第 一 , 它 必 须 是 一 个 生成 树 ,， 即 形成 一 棵 包含 图 上 所 
有 结 点 的 树 , 结 点 之 间 相 互联 通 且 没 有 环 。 第 二 , 图 上 可 能 存在 多 棵 生成 树 , MST 是 所 
有 生成 树 中 边 的 权重 和 最 小 的 那 棵 生成 树 。 图 8.10 的 右 图 中 深 色 线条 就 是 一 棵 最 小 生 
成 树 的 边 。 

为 了 求 出 给 定 图 中 的 最 小 生成 树 , 可 以 列举 出 所 有 的 生成 树 , 然后 依次 计算 各 个 生 
成 树 的 权重 和 ,最 小 权重 和 对 应 的 生成 树 就 是 满足 条 件 的 最 小 生成 树 。 图 中 的 每 一 条 边 
要 么 在 生成 树 上 , 要 么 不 在 , 只 有 这 两 种 可 能 。 图 共有 |E| 条 边 , 因此 列举 图 中 所 有 生成 
树 的 复杂 度 是 O(2I 引 ), 是 指数 时 间 复 杂 度 。 这 表明 穷 举 所 有 的 生成 树 并 不 是 一 个 高 效 的 
解决 办 法 。 那么 , 有 没有 更 好 的 办 法 来 求 给 定 输入 图 的 最 小 生成 树 呢 ? 


8.5.1 ”Prim 算法 


下 面 我 们 介绍 利用 贪心 策略 来 求解 MST 问题 的 算法 。 这 个 算法 在 1930 年 由 捷克 数 
学 家 Vojtach Jarnfk 提出 , 在 1957 年 美国 计算 机 和 数学 家 Robert Clay Prim 也 对 这 个 
问题 进行 了 研究 , 并 提出 了 类 似 的 求解 算法 。 

我 们 已 经 知道 , 利用 贪心 算法 求解 问题 需要 待 解 问题 具有 以 下 两 个 基本 属性 : 

。 优化 子 结构 。 待 求解 问题 能 被 分 解 成 若干 子 问题 ， 各 个 子 问题 的 最 优 解 就 构成 了 

待 求解 问题 的 优化 解 

。 贪心 策略 。 求 解 每 一 个 子 问题 的 局 部 最 优 解 ,最 终 获得 全 局 问题 的 最 优 解 

对 于 MST 问题 , 我 们 首先 看 是 否 存在 优化 子 结构 。 假 设 给 定 图 G 的 MST 为 了 树 
开 中 存在 两 个 相互 连接 的 结 点 u 和 v。 将 这 两 点 之 间 的 边 去 掉 , 那么 原 图 G 被 分 为 两 个 
子 图 G1 和 Go, 如 图 8.11。 此 时 , Gi 的 最 小 生成 树 为 Ti 。 

可 以 采用 反 证 法 来 证 明 这 个 结论 。 如 果 Ti 不 是 子 图 Gi 的 最 小 生成 树 , 那么 不 妨 设 
Gi 的 最 小 生成 树 为 Ti 。 那 么 树 TI 加 上 子 树 Te 和 u,v 之 间 的 边 , 就 构成 一 棵 新 的 生 
成 树 T', 且 该 生成 树 各 边 的 和 小 于 T, 这 与 我 们 假设 也 是 G 的 MST 矛盾 。 因此 , Gi 的 
最 小 生成 树 为 Ti 。 同 理 可 证 Go 的 最 小 生成 树 为 Ta。 
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图 8.11 MST 问题 具有 最 优 子 结构 


以 上 结果 表明 MST 问题 具有 最 优 子 结构 ， 下 面 需 要 考虑 的 是 贪心 策略 。 我 们 在 构 
造 图 G 的 MST 过 程 中 ,该 选择 哪 一 条 边 加 入 到 当前 结果 中 呢 ? 如 果 按 照 贪心 的 策略 ， 
显然 应 该 选择 权重 最 小 的 一 条 边 加 入 到 当前 树 中 。 也 就 是 说 , T 是 图 G=(V, E) 的 MST， 
且 结 点 集合 S 是 V 的 子 集 , 也 就 是 SC V。 假定 e=(u, v)e EB 是 一 条 最 小 权重 的 边 , 该 
边 连 接 结 点 集合 S 与 V-S。 可 以 证 明 , 边 e=(u, v) 是 最 小 生成 树 工 中 的 一 条 边 , ee T。 

以 上 的 结果 可 以 通过 “前 切 一 粘贴 ” 的 方法 

来 证 明 。 考 虑 图 G 的 最 小 生成 树 下 (如 图 8.12)， 
如 果 边 e=(u, v) 不 属于 MST 中 的 边 , 由 于 MST 
中 各 个 结 点 必须 相互 连通 , 因此 图 工 中 一 定 存 
在 一 条 从 结 点 u 到 结 点 v 的 路 径 。 由 于 ue 5,， 
VE V-S, 因此 一 定 存在 结 点 w ES 和 ve V-S， 
这 两 点 构成 边 =(u, v) 属于 T。 
于 选择 了 e， 而 不 是 e, 那么 我 们 考察 另 一 棵 生成 树 T'， 有 T'=T-eUe， 且 权重 
关系 w(T')=w(T) 一 w(e')+w(e)。 由 于 边 e 是 跨 过 s 与 V-S 之 间 的 最 小 权重 边 , 也 就 是 
Ww(e)< w(e'), 可 得 w(T')< w(T), 这 表明 树 T' 才 是 图 G 的 MST, 这 与 假设 了 是 G 的 
MST 矛盾 。 因 此 , 边 e=(u, v) 是 最 小 生成 树 了 中 的 一 条 边 , ee T。 

有 了 以 上 结论 后 , 可 以 很 容易 得 到 MST 的 算法 。 算法 的 基本 流程 是 : 

(1) 随机 的 从 图 G=(V, EE) 中 选择 一 个 结 点 s, 将 结 点 存储 于 集合 S, 即 S={s}; 

(2) S 与 V-S 间 权 重 最 小 的 边 为 e=(u v), 其 中 ue S, 将 结 点 v 加 入 到 S 中 ; 

(3) 重复 第 二 步 , 直到 所 有 的 结 点 均 加 入 到 S 中 。 

我 们 根据 图 8.13 所 示 , 来 演示 算法 执行 的 过 程 。 假定 随机 选择 va， 并 将 它 存储 到 
S={v2} 中 。 此 时 , S 与 V-S 间 权 重 最 小 的 边 为 va-va， 因 此 将 va 加 入 到 S={v2, v3}。 当 
前 S 与 V-S 间 权 重 最 小 的 边 为 vi-va, 将 vi 加 入 到 S={fva, va, V1}。 最 后 , S 与 V-S 间 








图 8.12 信心 策略 证 明示 意图 
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权重 最 小 的 边 为 va-va, 将 va 加 入 到 S={v2, va, V1, V4}。 此 时 , 所 有 结 点 均 加 入 到 S， 
图 8.13 中 深 色 边 即 为 所 求 的 MST。 








图 8.13 Prim 算法 示例 


8.5.2 ”算法 实现 


以 上 Prim 算法 的 一 个 主要 步骤 是 从 V-S 中 选择 一 个 符合 要 求 的 结 点 加 入 到 S 中 ， 
可 以 将 边 的 权重 耦合 到 结 点 上 , 根据 加 入 到 S 中 的 结 点 , 更 新 结 点 的 权重 值 。 每 次 选择 
结 点 耦合 的 权重 值 最 小 的 结 点 加 入 到 S。 这 样 可 以 考虑 用 优先 队列 来 存储 结 点 , 根据 结 
点 耦合 权重 值 来 对 队列 中 元 素 进行 组 织 , 每 次 选取 队列 的 第 一 个 元 素 加 入 S。 整 个 算法 
流程 为 : 

。 维护 一 个 优先 队列 Q 用 于 存储 结 点 集合 V-S 

。 将 S 置 为 空 , 并 将 所 有 的 结 点 V 存储 于 队列 Q 

。 任意 选择 一 个 结 点 se V 置 于 S 中 , 并 将 其 他 结 点 v.key 设 为 无 穷 大 , veV-{s} 
循环 直到 Q 为 空 
一 从 队列 中 取出 一 个 元 素 u 加 入 到 s 
一 对 于 结 点 u 的 所 有 邻居 结 点 v， 如 果 w(u,v)<v.key， 则 更 新 结 点 v 的 值 为 

V.key=w(u,v) 

。 循环 结束 后 返回 加 入 到 S 中 的 结 点 即 可 

算法 实现 见 代 码 8.6。 代 码 第 1 行 首先 导入 heapq, 经 由 堆 实现 优先 队列 。 第 3 行 申 
明了 一 个 类 PriorityQueue, 它 有 两 个 成 员 变 量 , pqueue 是 优先 队列 ，ke 用 于 记录 各 个 
结 点 的 键 值 。 第 13 行 的 循环 初始 化 PriorityQueue 的 对 象 Q, 源 点 source 的 key 记 为 
0, 其 他 各 个 结 点 的 key 记 为 无 穷 大 。 

代码 8.6 第 21 行 的 循环 遍历 堆 中 各 个 元 素 , 在 第 22 行 按照 贪心 策略 选择 结 点 v 加 
入 到 mst 中 。 第 25 行 的 循环 索引 结 点 v 的 所 有 邻居 结 点 u， 只 要 u 还 没有 加 入 到 mst 
中 , 且 它 的 键 值 大 于 u 与 v 之 间 边 的 权重 graph[v][u], 则 将 结 点 u 在 堆 中 的 键 值 进行 更 
新 。 代 码 第 28 行 先 找到 堆 中 元 素 (Q.key[ulu) 的 位 置 ind_key, 然后 删除 这 个 元 素 , 再 
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通过 堆 添加 函数 heapq.heappush( ) 将 具有 新 key 的 结 点 加 入 到 堆 中 ， 从 而 保持 该 结 


代码 8.6 最 小 生成 树 的 Prim 算法 





import heapq 


import math 


class PriorityQueue: 


def __init._(self): 
self .key = {} # 记录 结 点 的 key 值 
self .pqueue = [] # 用 于 建 堆 


def prim(graph,source): 


Q = PriorityQueue() 
mst = {} 
parent = {} 
# 将 图 中 结 点 初始 化 到 堆 中 
for V in graph: 
if V == source: 
Q.key[v] = 0 
heapq.heappush(Q.pqueue, (0, Vv)) 
else: 
Q.key[v] = math.inf 
heapq.heappush(Q.pqueue，(math.inf,v)) 
parent [source] = None 
while Q.pqueue: 
(v_key，v) = heapq.heappop(Q.pqueue) # 贪心 策略 ， 取 出 堆 中 最 小 元 素 
del Q.key[v] 
mst[v] = parent[v] 
for u in graph[v] : 
if u in Q.key and u not in mst: 
if graph[v] [u]<Q.key[u] : 
# 将 推 Q.pqueue 中 结 点 的 key 值 更 新 为 graph[v] [u] 
ind_key = Q.pqueue.index((Q.key[u] ,u)) 
Q.pqueue.pop(ind key) 
heapq.heappush(Q.pqueue, (graph[v] [u] ,u)) 
Q.key[u] = graph[v] [u] 
parent[u] = v 





Ll 


下 面 我 们 分 析 代 码 8.6 的 时 间 复 杂 度 , 第 13 行 到 第 19 行 遍历 了 图 中 各 个 结 点 ， 





因 


循环 ， 其 中 外 循环 的 Q 里 面 存储 图 中 各 





其 时 间 复 杂 度 为 O(|V|)。 第 22 行 之 后 是 双 和 























后 的 循环 , 上 














个 结 点 ， 内 循环 可 以 分 成 两 个 部 分 ， 第 一 部 分 是 第 22 行 从 Q 中 选择 最 小 元 素 , 这 部 分 
于 采用 堆 来 存储 Q, 因此 其 时 间 复 杂 度 为 O(log |V|)。 内 循环 的 第 二 部 分 是 第 25 行 之 
于 它 是 遍历 某 个 结 点 的 邻接 结 点 ， 


因此 与 外 循环 一 起 其 时 间 复 杂 度 就 是 遍 





历 了 图 上 所 有 的 边 , 即 O(|B|)。 代码 第 29 行 到 第 32 行 是 更 新 Q 中 一 个 元 素 的 值 ， 按 照 
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第 5.4 节 中 关于 堆 结构 操作 函数 的 分 析 知 , 这 段 代 码 的 执行 时 间 复 杂 度 为 O(log |V|)。 因 
此 , 利用 堆 实现 的 Prim 算法 时 间 复 杂 度 为 : 





T(n) = O(V|)+ O(IVllog(IV|)) + O(EI(ogIV))) = 0O(IVlloglV|) (8.5) 








如 果 Q 采用 普通 数组 , 那么 第 22 行 从 Q 中 找 出 最 小 元 素 时 间 应 该 为 O(|V|), 第 29 
行 到 第 32 行 是 更 新 Q 中 一 个 元 素 值 的 时 间 复 杂 度 为 O(1), 因此 其 时 间 复 杂 度 为 : 











T(n) = O(IV|) + O(IVIIVD) + 0(IEl) = O(IVIIV)) (8.6) 


以 上 分 析 结 果 表 明 , 采用 堆 结构 实现 的 Prim 算法 相 比 较 于 数组 的 实现 方式 , 其 算 
法 更 为 高 效 。 

以 图 8.14 为 例 , 来 说 明 算 法 的 执行 过 程 。 算法 执行 前 初始 化 S 和 Q, 得 S={}， 
Q={A, B, C, D, E, F, G, H}。 选择 Q 中 结 点 G 为 初始 结 点 , 则 S={G}。 与 G 相 邻 的 















9 
15 


5 





图 8.14 Prim 算法 示例 
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三 个 结 点 C、F 和 G 上 的 值 原来 为 无 穷 大 , 现 分 别 更 新 为 7,10, 15。 由 于 Q 中 结 点 的 
值 发 生变 化 , 根据 队列 性 质 各 个 结 点 位 置 亦 会 随 着 变化 。 由 于 Q 是 一 个 优先 队列 , 即 队 
列 中 最 小 值 元 素 在 队列 的 第 一 个 位 置 , 因此 Q={C, F, G, A, B, D, E, H}。 当 从 Q 中 取 
出 一 个 元 素 置 于 S, 此 时 取 到 的 结 点 应 该 是 C, 也 就 是 当前 S 与 V-S 间 边 的 权重 最 小 边 
被 选择 到 。 该 边 即 为 G 点 与 C 点 间 的 边 , 权重 值 为 7。 依照 这 个 过 程 ， 最 终 得 到 图 8.14 
右 下 图 所 示 的 最 小 生成 树 ， 生 成 树 中 各 个 结 点 的 边 加 粗 。 








8.6 小结 


2016 年 计算 机 界 最 大 的 新 闻 之 一 就 是 Google DeepMind 公司 研发 的 阿尔 法 Go, 在 
5 番 围 棋 大 战 中 打败 了 当时 围棋 界 第 一 人 李 世 石 。 围 棋 是 一 项 非常 复杂 的 智力 游戏 ,其 
对 奔 的 目的 非常 简单 ,就 是 尽 可 能 多 的 占 取 更 多 的 “地 盘 ”。 阿尔 法 Go 如 果 仅仅 考虑 当 
前 收益 ， 而 不 对 棋局 后 续 变 化 进行 推理 是 很 难 打败 职业 围棋 高 手 的 。 本 章 介 绍 的 贪心 算 
法 恰恰 与 阿尔 法 Go 的 策略 不 同 , 贪心 意味 着 每 一 步 都 要 求 当前 获得 最 好 的 收益 。 似 乎 
这 是 一 种 非常 “目光 短 浅 ” 的 算法 , 然而 通过 本 章 的 介绍 我 们 知道 , 贪心 算法 在 求解 问题 
时 不 仅 简单 , 有 时 也 能 获得 全 局 最 优 解 。 当 然 , 是 否 能 获得 最 优 解 , 是 需要 通过 证 明 才 能 
确定 的 ， 并 不 是 说 使 用 贪心 策略 就 一 定 能 得 到 最 优 解 。 

在 使 用 贪心 算法 求解 问题 时 , 与 分 治 算法 类 似 也 需要 先 将 问题 划分 成 若干 简单 的 子 
问题 , 这 让 我 们 再 次 体会 到 从 大 到 小 转化 的 力量 。 对 于 每 一 个 子 问题 我 们 尝试 采用 贪心 
策略 去 求解 。 需 要 特别 指出 ,此 时 可 能 存在 多 种 贪心 策略 , 这 要 求 我 们 在 这 多 种 策略 中 
寻找 一 个 能 获得 期 望 解 的 策略 。 贪心 算法 往往 能 获得 较 高 的 执行 效率 , 这 是 因为 它 并 非 
在 整个 空间 寻找 最 佳 策 略 , 而 是 只 选择 当前 情景 下 最 好 的 一 个 策略 。 因此 , 贪心 算法 的 
复杂 度 分 析 相 对 较为 简单 。 

此 外 ， 本章 还 在 实现 Dijkstra 和 Prim 算法 时 , 通过 堆 结构 来 优化 算法 执行 效率 。 
这 里 之 所 以 采用 堆 结 构 ， 是 因为 这 两 个 算法 都 需要 频繁 的 从 序列 中 选择 最 小 元 素 。 此 
时 , 采用 堆 结构 存储 序列 ,那么 得 到 其 中 最 小 元 素 的 时 间 复 杂 度 将 从 原来 用 普通 数组 的 
O(n) 提高 到 O(log(n))。 


课 后 习题 


习题 8-1 ” 装 箱 问题 

给 定 n 件 物品 的 序列 ， 以 及 容量 为 c 的 箱子 。 要求 将 物品 装 入 到 箱子 , 每 一 个 箱子 
装 人 的 物品 总 重量 不 能 超过 箱子 的 容量 。 给 出 一 个 算法 , 要 求 用 最 小 的 箱子 数 将 物品 全 
部 装 入 。 

比如 有 6 个 物品 , 其 重量 分 别 为 [4, 8, 1, 4, 2, 1], 箱子 容量 c=10。 那么 最 少 需要 2 
个 箱子 将 物品 全 部 装 入 , 其 中 一 个 箱子 装 入 [4, 4, 2], 另 一 个 箱子 装 入 [8, 2]。 
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习题 8-2 ”完成 任务 的 最 小 时 间 

给 定 一 组 不 同 的 任务 完成 时 间 job。 有 大 位 不 同 的 工人 被 要 求 去 完成 这 些 任 务 , 工 
人 完成 任务 的 单位 时 间 为 T。 设 计算 法 找 出 完成 任务 的 最 小 时 间 。 完 成 这 些 任务 有 以 下 
限定 : 

。 每 位 工人 只 能 被 分 配 连续 的 任务 。 比 如 有 工作 1, 2, 3, 那么 不 能 将 1 和 3 分 配给 

1 个 于 大 

。 一 个 工作 只 能 指定 一 位 工人 

比如 , k=2, T=5, job = [4, 5, 10]。 那么 最 少 需 要 50 个 单位 时 间 完 成 任务 , 其 分 配 
方案 是 将 任务 [4,5] 分 配给 工人 1, 任务 [10] 分 配给 工人 2。 

当 太 二 4, 了 = 5, job = [10, 7, 8, 12, 6, 8], 其 中 4 位 工人 的 工作 分 配方 案 为 [10]， 
[7, 3], [12], [6, 8], 最 小 完成 时 间 为 75。 
习题 8-3 ”集合 覆盖 问题 

一 个 集合 U 以 及 UU 内 元 素 构成 的 若干 个 小 类 集合 S= {s1, s?，…，sm}, 每 一 个 si 
均 有 一 个 价值 。 给 定 一 个 算法 , 要 去 找到 S 的 一 个 子 集 , 该 子 集 满足 所 含 元 素 包含 了 所 
有 的 元 素 且 使 小 类 集合 的 总 价值 最 小 。 

例如 ，U=[1, 2, 3, 4, 5], S = [s1, s2, sa]。 其 中 , si = [4, 1, 3], Cost(s1) = 5; s2 = 
[2, 5]，Cost(s2) = 10; ss = [1,4,3,2], Cost(s2) = 3。 选 择 集合 [sa, ss] 可 完成 价值 最 小 的 
完美 覆盖 ， 此 时 价值 为 13。 
习题 8-4 路径 问题 

(a) 给 定 一 个 有 向 无 环 图 G=(E, V)， 其 中 各 个 边 的 权重 均 为 1, 给 出 按照 Dijkstra 
算法 求 出 从 图 中 原点 到 各 个 结 点 的 最 短路 径 ， 并 利用 宽度 优先 搜索 求 图 G 各 点 的 最 短 
路 径 。 

(b) 给 定 一 个 有 向 无 环 图 G=(E, V), 如 果 边 存 在 小 于 0 的 权重 ,是否 仍然 可 以 利用 





Dijkstra 算法 求 得 从 原点 到 各 点 的 最 短路 径 ? 
习题 8-5 ”最 小 生成 树 
(a) 给 出 最 小 生成 树 的 定义 。 


(b) 描述 Prim 算法 的 流程 ,并 给 出 实现 代码 找 出 给 定 图 的 最 小 生成 树 。 


第 9 章 动态 规划 算法 


本 章 学 习 目 标 
。 了 解 动态 规划 算法 求解 优化 问题 的 步骤 
。 掌握 利用 动态 规划 算法 求解 简单 的 优化 问题 , 并 分 析 其 时 间 复 杂 度 
。 能 画 出 动态 规划 表 , 并 从 中 得 到 问题 的 解 

















9.1 引言 


20 世纪 50 年 代 初 美国 数学 家 R.E.Bellman 在 研究 多 阶段 决策 过 程 的 优化 问题 
时 , 提出 了 著名 的 最 优化 原理 , 把 多 阶段 过 程 转化 为 一 系列 单 阶段 问题 , 利用 各 阶段 之 
间 的 关系 逐个 求解 , 创立 了 解决 这 类 过 程 优化 问题 的 新 方法 一 一 动态 规划 (Dynamic 
Programming ) 。 

动态 规划 在 计算 生物 ， 决 策 理论 和 计算 金融 等 领域 均 有 广泛 应 用 。 它 是 一 种 强大 的 
算法 设计 技术 , 常常 用 于 求解 最 优化 问题 。 在 第 8 章 我 们 已 经 学 习 了 利用 贪心 算法 求解 
优化 问题 , 也 知道 最 优化 问题 的 目标 往往 是 求 诸如 最 大 值 、 最 小 值 、 最 长 或 最 短 值 等 。 这 
些 最 优化 问题 如 果 使 用 简单 的 穷 举 算法 求解 ， 其 时 间 复 杂 度 往往 会 是 指数 规模 ,而 采用 
动态 规划 算法 后 ,时 间 效 率 则 会 优化 至 多 项 式 规模 。 然而 , 动态 规划 并 不 是 一 个 具体 的 
算法 , 它 是 一 类 算法 设计 技术 ，, 本章 将 通过 各 种 有 趣 的 实例 向 读者 展示 动态 规划 算法 求 
解 优化 问题 的 原理 和 基本 步骤 。 

在 第 4.3 节 我 们 已 经 学 习 了 使 用 递归 算法 来 求解 斐 波 那 契 数 ， 其 时 间 复 杂 度 为 指数 
规模 。 本 章 将 从 斐 波 那 契 数 开始 , 利用 动态 规划 来 得 到 一 个 高 效 地 求解 斐 波 那 契 数 的 算 
法 。 通 过 求解 斐 波 那 契 数 , 归纳 出 使 用 动态 规划 求解 优化 问题 的 常用 步骤 。 然 后 , 根据 总 
结 的 步骤 依次 介绍 如 何 使 用 动态 规划 求解 “ 拾 捡 硬币 ”“ 连 续 子 序 列 和 的 最 大 值 ” 与 “ 文 
本 排版 ” 等 一 维 优化 问题 ， 以 及 “矩阵 的 括号 ”““ 字 符 串 编辑 距离 ”和 “0/1 背包 ”的 二 维 
优化 问题 , 通过 这 些 有 趣 的 实例 向 读者 展示 动态 规划 强大 的 功能 ， 以 及 动态 规划 求解 问 
题 的 具体 步骤 。 


9.2 ”再 遇 斐 波 那 契 数 


我 们 在 4.3 节 曾 经 介绍 过 斐 波 那 契 数 ,并且 利 用 递归 算法 求解 了 斐 波 那 契 数 。 通 过 
分 析 可 知 , 采用 递归 算法 ( 见 代 码 4.2) 求解 辈 波 那 契 数 的 算法 时 间 复 杂 度 是 O(2")。 下 面 
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我 们 介绍 如 何 利用 动态 规划 来 求解 斐 波 那 契 数 ， 从 而 获得 时 间 复 杂 度 为 O(n) 的 实现 。 
斐 波 那 契 数 由 以 下 递归 式 定义 : 


n, 人 二 人 1 
f(n) = (9.1) 
人 一 1]) 十 f(n 一 2)， 其 他 


为 了 便于 理解 , 我 们 将 利用 递归 算法 计算 n= 5 时 的 辈 波 那 契 数 的 执行 过 程 用 一 棵 
树 表 示 ( 如 图 9.1)。 树 中 的 每 个 结 点 表示 一 次 函数 调用 , 如 结 点 fib(4) 表示 输入 参数 为 4 
时 调用 递归 函数 fib()。 为 了 计算 fib(5), 图 9.1 将 所 有 被 调用 到 的 函数 和 调用 关系 都 用 
树 结 构 表示 出 来 。 显然 , 为 了 计算 fib(5), 树 中 的 每 一 个 结 点 根据 深度 优先 依次 遍历 到 。 
然而 , 不 难 发 现 这 棵 树 有 许多 重复 的 结 点 , 如 有 2 个 fib(3) 结 点 和 3 个 fib(2) 结 点 。 这 
些 重复 的 结 点 在 求解 过 程 中 都 会 被 重复 的 展开 进行 计算 。 因 此 , 采用 递归 算法 求解 辈 波 
那 契 数 时 ， 其 函数 调用 中 存在 许多 重复 ,这 是 导致 其 效率 低下 的 主要 原因 。 





图 9.1 斐 波 那 契 数 的 递归 求解 


既然 算法 的 实现 过 程 存在 诸多 重复 的 函数 调用 , 那么 为 了 提高 算法 执行 效率 , 应 该 
考虑 优化 这 些 重复 的 函数 调用 。 我们 采用 的 方法 非常 简单 , 记忆 。 也 就 是 说 , 在 计算 出 一 
个 输入 参数 为 n 的 斐 波 那 契 数 fib(n) 后 , 就 把 fib(n) 用 表 的 形式 存储 下 来 。 在 函数 递归 
调用 前 ,首先 在 表 中 查找 函数 对 应 参数 的 值 是 否 在 表 中 。 如 果 表 中 没有 对 应 的 值 ， 说 明 
该 参数 对 应 的 函数 还 未 被 调用 ,那么 就 调用 该 参数 对 应 的 递归 函数 ; 否则 , 说 明 该 参数 
的 斐 波 那 契 数 已 经 计算 出 来 , 这 时 就 不 用 调用 该 参数 对 应 的 递归 函数 , 而 是 直接 将 表 中 
存储 的 斐 波 那 契 数 返回 即 可 。 

以 上 过 程 见 示意 图 9.2, 执行 到 结 点 fb(4) 需要 递归 调用 fb(3) 和 fib(2), fib(3) 函 
数 已 经 执行 且 返 回 值 3。 此 时 , fib(4) 需要 递归 调用 函数 fib(2), 然而 由 于 fib(2) 的 值 已 
经 在 表 中 , 因此 不 需要 去 展开 结 点 fib(2), 而 是 直接 查 表 得 到 fib(2)=2, 这 样 可 以 算出 
fib(4)=5。 

以 上 过 程 的 实现 见 代 码 9.1。memo 是 Python 的 字典 数据 结构 , 它 的 关键 字 为 参数 
mn， 值 为 参数 ”对 应 的 斐 波 那 契 数 fib(n)。 在 确定 是 否 递归 求解 参数 n 的 函数 前 ,由 代 





第 9 章 动态 规划 算法 149 








图 9.2 记忆 中 间 过 程 


码 9.1 第 3 行 来 判断 该 参数 ”的 斐 波 那 契 数 是 否 存在 于 表 中 。 如 果 该 参数 对 应 的 斐 波 那 
契 数 存在 ,， 则 直接 返回 表 中 的 斐 波 那 契 数 , 否则 , 调用 函数 递归 求解 fb(n)。 需 要 特别 注 
意 的 是 , 在 求 出 ib(n) 后 , 应 将 该 值 由 代码 9.1 第 10 行将 结果 存储 于 变量 memo 中 。 


代码 9.1 利用 记忆 求解 斐 波 那 契 数 


memo = { 
def fib2(n): 
if n in memo: # 查 表 
return memo[n] 
else: 
if n <= 2: # 边界 条 件 
f=1 
else: 
f = fib2(n-1) + fib2(n-2) # 递归 调用 
memo[n] = 工 # 将 结果 存储 于 表 中 
return f 


下 面 我 们 分 析 代码 9.1 求解 斐 波 那 契 数 的 时 间 复 杂 度 。 求 解 fb(n) 时 , 对 于 每 一 个 
参数 对 应 的 函数 fib( )， 只 存在 一 次 递归 调用 , 共有 mn 次 调用 。 这 是 因为 第 二 次 调用 的 时 
候 , 不 需要 递归 展开 , 而 只 需要 查 表 得 到 值 , 查 表 的 时 间 复 杂 度 为 O(1)。 因 此 , 按照 代 
码 9.1 求解 辈 波 那 契 数 的 时 间 复 杂 度 为 O(n)。 

通过 以 上 求解 斐 波 那 契 数 的 例子 可 以 看 到 , 利用 记忆 可 以 将 原来 指数 时 间 复 杂 度 的 
递归 算法 提高 到 线性 时 间 复 杂 度 。 之 所 以 有 这 样 的 变化 ,主要 是 因为 求解 辈 波 那 契 数 的 
递归 展开 存在 许多 的 重复 子 问题 。 存 在 重复 的 子 问题 ， 就 可 通过 记忆 来 提高 递归 实现 的 

为 什么 通过 记忆 这 一 实现 技巧 就 可 以 提高 算法 效率 ? 我 们 仍然 以 筹集 善 款 的 问题 为 
例 , 求解 该 问题 的 策略 是 将 自己 需要 筹集 的 款 数 分 解 , 然后 找 朋友 帮助 筹集 分 解 后 的 款 
项 。 显然 , 在 不 停 地 找 朋 友 时 , 很 有 可 能 菜 人 是 许多 人 的 朋友 , 那么 他 可 能 会 接受 到 
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份 筹 款 邀 请 。 遇 到 这 种 情况 的 时 候 ， 这 位 人 缘 非常 好 的 朋友 会 重复 次 他 的 筹 款 计划 。 
如 果 这 位 人 缘 非常 好 的 朋友 恰好 是 一 位 银行 家 , 而 且 非 常 有 善心 。 一旦 他 收 到 筹 款 的 邀 
请 , 就 可 以 直接 到 他 的 银行 取款 捐献 ,而 不 需要 再 想 办 法 再 去 找 他 的 10 个 朋友 筹 钱 。 显 
然 , 相 比较 于 从 银行 直接 取 钱 , 通过 不 停 找 朋 友 来 筹 款 这 个 过 程 要 低 效 很 多 。 


代码 9.2 自 底 向 上 求解 斐 波 那 契 数 





def fib_bottom up(n): 


fib = {} # 存储 结果 的 字典 
for k in range(n+1): 
if k<=2: # 边界 条 件 
f=1 
else: 
f = fib[k-1]+fib[k-2] # 自 底 向 上 填 表 
fib[k] = 工 


return fib[n] 


除了 利用 记忆 实现 递归 外 , 还 可 以 用 自 底 向 上 的 方法 来 实现 递归 ,如 代码 9.2 所 示 。 
代码 直接 采用 循环 来 代替 递归 函数 调用 。fib(0) 和 fib(1) 是 边界 条 件 ， 有 了 它们 就 可 以 
求 出 fib(2)。 有 了 fib(1) 和 fib(2), 则 可 以 求 fb(3)。 因 此 , 索引 i 从 2 依次 递增 到 n, 根 
据 递归 式 仅仅 使 用 循环 ,而 非 递归 函数 实现 求解 斐 波 那 契 数 。 

代码 9.2 的 实现 可 看 作 如 图 9.3 所 示 的 执行 过 程 。 图 中 每 一 结 点 代表 一 个 参数 对 应 
的 斐 波 那 契 数 。 任 意 一 个 结 点 求 值 所 需要 的 信息 , 都 是 已 经 求 出 的 结 点 值 。 也 就 是 说 , 当 
前 结 点 的 值 只 与 该 结 点 左边 的 结 点 有 关 , 与 该 结 点 右边 结 点 无 关 ， 而 当前 结 点 左边 结 点 
的 值 均 已 经 算出 。 具 体 而 言 ,如果 要 求 fb(5) 这 个 结 点 的 值 , 需要 知道 这 个 结 点 左边 结 
点 的 值 , 而 该 结 点 左边 结 点 的 值 在 求 结 点 fib(5) 之 前 便 已 经 得 到 。 

如 果 将 代码 9.1 看 作 是 自 顶 向 下 的 求解 斐 波 那 契 数 ， 那 么 代码 9.2 就 是 自 底 向 
上 求解 斐 波 那 契 数 。 之 所 以 称 为 自 底 向 上 ， 是 因为 在 求解 fb(n) 的 值 时 ,我 们 从 
fib(0), fib(1), fib(2) 开始 直到 fib(m)。 自 底 向 上 的 实现 递归 , 总 是 利用 已 知 的 信息 去 求 
未 知 的 信息 , 这 相当 于 对 图 9.3 进行 拓扑 排序 后 得 到 的 结 点 顺序 。 


起 GCT 


图 9.3 求解 斐 波 那 契 数 的 有 向 无 环 图 


代码 9.2 和 代码 9.1 功能 等 价 , 且 算 法 复杂 度 也 是 O(mz)。 显 然 , 由 于 代码 9.2 中 没 
有 递归 , 因此 更 易于 分 析 其 算法 复杂 度 。 本 章 后 面 的 例子 都 将 通过 自 底 向 上 的 方式 来 实 
现 递归 。 
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也 许 读者 会 非常 惊奇 ,本 节 介 绍 的 求解 斐 波 那 契 数 算法 就 是 动态 规划 ,似乎 非常 简 
单 。 的 确 是 , 动态 规划 并 不 复杂 , 它 求解 问题 的 过 程 是 有 迹 可 循 的 。 一 般 来 说 , 利用 动态 
规划 求解 问题 可 以 归纳 为 以 下 5 个 简单 的 步骤 : 

(1) 定义 子 问题 

(2) 猜测 部 分 解 ; 

(3) 建立 各 个 子 问题 之 间 的 递归 关系 ; 

(4) 自 底 向 上 的 求解 递归 式 ; 

(5) 组 合 所 有 子 问 题 的 解 从 而 获得 原 问题 的 解 。 

也 许 读者 会 奇怪 为 什么 动态 规划 需要 第 二 步 的 猜测 ,难道 算法 设计 中 需要 靠 猜 才能 
得 到 解 。 猜 的 确 在 算法 设计 中 有 非常 重要 的 作用 , 这 里 的 猜 主 要 是 用 于 建立 子 问 题解 的 
关系 , 或 者 说 是 一 种 试探 法 。 也 就 是 说 ， 如果 对 于 一 个 待 求解 的 问题 , 在 对 解 的 形式 完 
全 不 清楚 的 情况 下 , 何不 先 猜 测 一 个 解 。 这 样 便于 建立 各 个 子 问 题解 之 间 的 关系 。 后面 
各 节 将 通过 各 类 有 趣 的 实例 , 来 介绍 动态 规划 如 何 利用 以 上 5 个 步骤 求解 具体 的 优化 
问题 。 

下 面 对 照 求解 斐 波 那 契 数 的 过 程 ,简单 描述 一 下 各 个 步骤 进行 的 计算 ; 

。 子 问题 为 fib(k), 其 中 , 1< 有 < n, 因此 共有 nn 个 子 问题 

。 了 于 问题 的 解 由 式 (9.1) 直接 给 出 

。 各 个 子 问题 之 间 的 递归 关系 同样 可 以 根据 式 (9.1) 得 到 

e 代码 9.2 给 出 了 自 底 向 上 求解 递归 式 (9.1) 的 实现 , 图 9.3 表明 求解 的 过 程 满足 

拓扑 排序 

。 图 9.3 中 最 后 一 个 单元 fib(n) 就 是 原 问题 的 解 

从 以 上 5 个 步骤 不 难看 出 ， 记忆、 递归 与 猜测 是 动态 规划 的 三 个 重要 的 组 成 部 分 。 
我 们 把 动态 规划 归纳 为 : 通过 递归 来 得 到 求解 子 问题 的 策略 , 经 由 猜测 来 建立 子 问 题解 
的 关系 , 而 利用 记忆 来 得 到 递归 的 高 效 实现 。 

动态 规划 算法 的 运行 时 间 等 于 子 问题 数 x 每 个 子 问题 的 求解 时 间 。 以 代码 9.1 而 
言 , 子 问 题 个 数 为 n, 每 个 子 问 题 求解 的 时 间 OU 总, 因此 该 算法 的 时 间 复 杂 度 为 O(n)。 





9.3 ”一 维 动态 规划 


在 利用 动态 规划 求解 优化 问题 时 ， 如果 划分 子 问 题 的 参数 只 有 1 个 。 在 建立 了 子 问 
题 间 的 递归 关系 后 , 问题 求解 的 过 程 就 是 根据 递归 式 填写 一 张 一 维 表 的 数据 ， 本 书 将 这 
类 问题 统称 为 一 维 动态 规划 问题 。 比 如 , 求 斐 波 那 契 数 的 参数 就 是 1 个 , 即 待 求 斐 波 那 
契 数 的 整数 m。 因 此 ,我们 将 9.2 节 求 斐 波 那 契 数 的 问题 归 类 为 一 维 动态 规划 。 下 面 将 
根据 动态 规划 求解 问题 的 5 个 基本 步骤 ,向 读者 详细 介绍 如 何 根据 这 些 步 骤 求 解 具体 的 
问题 。 








@ 这 里 第 二 次 递归 调用 的 时 间 复 杂 度 为 O(1)。 
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9.3.1 “ 拾 捡 硬币 
假如 有 个 硬币 排 在 一 行 , 如 
c[0], c[1], +…, co—1] 


要 求 不 能 拾取 相 邻 的 两 个 硬币 ,以 获得 累加 面值 最 大 的 拾取 子 序列 。 比 如 ,， 有 面值 
如 下 的 硬币 : 
5,1;2,10,6,2 


可 以 拾取 5 十 2 十 6 = 13, 也 可 以 拾取 1 二 10 十 2 = 13。 以 上 两 种 拾取 的 硬币 均 不 相 
邻 , 因此 都 是 符合 要 求 的 拾取 方式 。 但 是 , 最 大 总 面值 的 拾取 应 是 5 十 10 十 2 = 17。 这 个 
拾取 首先 没有 相 邻 的 硬币 ， 而 且 是 所 有 可 行 拾取 中 累加 面值 最 大 的 一 个 拾取 。 

以 上 问题 最 直接 的 算法 是 求 出 所 有 可 行 的 拾取 子 序 列 ， 并 求 出 它们 各 自 的 累加 值 ， 
其 中 累加 值 最 大 的 序列 就 是 所 求 结 果 。 也 就 是 ， 从 输入 序列 中 穷 举 所 有 可 行 序列 。 由 于 
序列 中 每 一 个 元 素 要 么 在 所 求 序列 中 , 要 么 不 在 , 这 样 将 有 2" 个 可 行 序列 。 因 此 , 采用 
穷 举 法 来 求解 该 问题 的 算法 效率 是 指数 规模 ,下 面 将 介绍 通过 动态 规划 来 获得 一 个 更 为 
高 效 的 算法 。 

定义 子 问题 

不 妨 设 从 硬币 c[0] 直到 cli] 中 累加 和 最 大 的 值 为 collect_coins(i)。 如 果 将 每 一 个 硬 
币 都 当成 一 个 字符 , 输入 硬币 的 前 绥 c[: i] 就 是 定义 的 子 问题 ， 该 子 问题 的 求解 函数 示 为 
collect_coins( )。 由 于 i 取 值 [0,n 一 1]， 因此 子 问 题 的 个 数 为 n。 


猜测 解 

利用 动态 规划 求解 斐 波 那 契 数 时 ， 由 于 直接 给 出 了 斐 波 那 契 数 的 递归 式 ， 因 此 并 不 
需要 猜测 解 这 一 步 。 然 而 ， 当 利用 动态 规划 求解 大 部 分 问题 时 ， 都 需要 我 们 构建 问题 的 
递归 解 。 为 了 求 得 子 问题 的 解 ， 就 需要 使 用 猜测 这 一 方法 。 猜 测 就 是 一 种 尝试 或 者 假设 。 
对 于 子 问题 cl: i], 考察 硬币 四 ， 它 存在 两 种 可 能 的 猜测 : 

。 最 优 解 不 包括 第 i 个 硬币 。 那 么 前 i 个 硬币 累加 和 最 大 值 应 等 于 collect_coins(i 一 1) 

。 最 优 解 包括 第 i 个 硬币 。 那么 前 i 个 硬币 累加 和 最 大 值 则 等 于 collect_coins(i 一 

2) 十 c[ 

如 图 9.4 所 示 , 在 子 问题 c[: i] 的 解 中 , 我 们 考察 硬币 cli]。 对 于 c[ 轩 ,不 妨 先 猜测 最 
优 解 中 不 包括 硬币 c 四 ， 则 子 问 题 c[: i 一 1] 的 解 等 于 子 问 题 c[: 让 的 解 。 比 如 c[: 计 =[5, 1， 
2, 10, 6], 该 子 问 题 的 解 为 5 十 10 = 15, 最 后 的 硬币 6 不 在 最 优 解 中 , 那么 将 硬币 6 拿 
后 剩余 的 子 问 题 为 c[: i 一 1]=[5, 1, 2, 10]， 这 个 子 问题 的 解 依然 是 5 十 10 = 15。 

此 外 , 硬币 cfj] 也 可 能 就 在 最 优 解 中 , 那么 子 问题 c[: 让 的 解 应 等 于 子 问题 c[: i 一 2] 
的 解 加 上 硬币 c[i] 的 面值 。 比 如 , 子 问题 c[: i]=[5, 1, 2, 10], 其 最 优 解 为 5 十 10 = 15。 硬 
币 10 在 最 优 解 中 , 那么 子 问题 c[: i 一 3]=[5, 1] 的 最 优 解 为 5, 因此 子 问 题 c[:i] 的 最 优 解 
15 等 于 子 问 题 c[:i 一 2] 的 最 优 解 5 加 上 ci]=10。 
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子 问 题 c[:i-1] 


Fs 
子 问题 c[ :可 () 人) @IY 


Fe 
(局 帮 如) (器 子 问题 c[:i -2] 
C9) CO ~ 


图 9.4 猜测 部 分 解 


子 问题 之 间 的 递归 关系 
根据 以 上 分 析 , 不 难得 到 子 问题 之 间 的 递归 关系 : 


collect_coins(i) = max{c[i— 1] + collect_coins(i — 2), collect_coins(i— 1)},i > 2 (9.2) 


该 递归 式 表 明 collect_coins(i) 要 么 等 于 collect_coins(i 一 1)， 要么 等 于 collect- 
coins(i 一 2)+cli 一 1]。 由 于 原 问题 是 求 最 大 的 累加 面值 ， 因 此 collect_coins(i) 的 值 
应 该 等 于 它们 之 中 较 大 的 那个 。 当 没有 硬币 时 ，collect_coins( )=0。 只 有 一 个 硬币 的 
话 ，collect_coins( ) 应 该 等 于 当前 的 硬币 面值 。 因此 , 式 (9.2) 的 边界 条 件 为 ， 


collect_coins(0) = 0, collect_coins(1) = c[0] 


递归 式 (9.2) 存在 诸多 重复 的 子 问 题 , 如 collect_coins(1), collect_coins(2), collect_ 

coins(3) 等 。 此 外 , 还 存在 优化 的 子 结构 , 也 就 是 原 问 题 的 最 优 解 可 由 各 个 子 问题 的 最 优 
合成 得 到 。 这 意味 着 如 果 采 用 自 底 向 上 的 方法 实现 递归 式 (9.2), 可 以 获得 较 高 的 执行 

效率 。 

自 底 向 上 构造 动态 规划 表 

建立 了 子 问 题 间 的 递归 关系 , 就 可 以 利用 自 底 向 上 的 方法 求解 递归 关系 。 自 底 向 上 
实现 递归 的 本 质 就 是 填 表 , 我 们 称 该 表 为 动态 规划 表 。 一 个 子 问题 就 对 应 于 表格 的 一 个 
单元 格 ， 每 一 个 单元 格 的 值 经 由 递归 式 来 完成 计算 。 因 此 , 单元 格 在 计算 过 程 中 存在 相 
互 依赖 关系 。 

为 了 保证 动态 规划 表 内 每 一 个 单元 格 在 计算 过 程 中 都 有 足够 的 数据 ,因此 填 表 的 过 
程 必须 满足 拓扑 排序 。 也 就 是 说 , 表 中 某 个 单元 的 值 只 依赖 于 已 有 值 的 单元 格 。 如 图 9.5 
所 示 , 每 一 个 结 点 代表 一 个 子 问题 , 该 子 问题 要 么 依赖 于 前 一 个 结 点 , 要 么 依赖 于 前 两 
个 结 点 。 图 9.5 中 最 左边 的 两 个 结 点 代表 初始 值 ， 有 了 初始 值 就 可 以 按照 图 中 所 示 的 方 
向 从 左 向 右 依次 求解 各 个 子 问题 的 解 。 

可 以 根据 图 9.5 所 示 的 结构 , 设计 自 底 向 上 的 填 表 程 序 ， 见 代码 9.3。 该 代码 与 上 节 
求解 斐 波 那 契 数 自 底 向 上 实现 代码 类 似 , 首先 声明 了 一 个 变量 为 table 的 表 (动态 规划 
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图 9.5 子 问 题 求解 满足 拓扑 排序 


表 ), 通过 比较 table[i 一 2] + row_coins[ 一 1] 和 tableli 一 1] 的 大 小 , 选择 其 中 较 大 的 填 
入 表 中 的 第 i 个 位 置 。 如 果 输 入 的 硬币 为 [5, 1, 2, 10, 6, 2], 那么 按照 代码 9.3 得 到 的 表 
格 值 如 表 9.1 所 示 。 


代码 9.3 自 底 向 上 实现 递归 策略 


def bottom_up_coins (Tow_coins) : 
table = [None] * (len(row_coins) + 1)  # 申明 表格 
table[0] = 0 # 表格 初始 化 
table[1] = row_coins[0] 
for i in range(2, len(row_coins)+1): 
table[i] = max(table[i-2] + row_coins[i-1] ，table[i-1])  # 填 表 
return table 


表 9.1 自 底 向 上 方法 得 到 的 表格 值 列 表 
i 0 下 2 3 4 5 6 
table[i] 0 5 5 了 15 15 17 





动态 规划 求解 拾 捡 硬币 问题 的 子 问题 个 数 为 O(n), 每 一 个 子 问题 的 复杂 度 为 O(1)， 
因此 算法 的 时 间 复 杂 度 为 O(n)。 

原始 问题 的 解 

最 终 解 存储 于 表格 的 最 后 一 个 单元 。 如 果 需 要 返回 到 底 捡 了 哪 几 个 硬币 ， 可 以 根据 
表 的 值得 到 最 终 解 。 这 一 信息 可 以 根据 表 中 每 一 个 单元 来 自 于 之 前 的 哪个 单元 〈 父 结 
点 ) 得 到 。 当 前 单元 的 值 只 与 它 左边 的 两 个 格子 有 关 ， 当 table[fil>table[i 一 1], 则 意味 着 
table[i] 的 父 结 点 应 该 是 table[i 一 2]。 从 单元 格 的 最 后 一 位 开始 计算 , 得 到 的 结果 存储 于 
select， 实现 见 代码 9.4。 


代码 9.4 ”回溯 得 到 拾 捡 硬币 问题 最 优 解 





def trace_back_coins (row_coins ,table) : 
select = [] 
i = len(row_coins)  # i 从 表格 最 后 一 位 来 索引 
while i >= 1: 
if table[i] > table[i-1]: 


wo wm ~ a 
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select .append(row_coins[i-1]) 
i -= 2 

else: 
i-=1 


return select 





求解 原始 问题 的 算法 只 有 一 个 循环 , 它 遍历 有 n 个 元 素 的 表格 , 因此 其 时 间 复 杂 度 
为 O(n)。 

需要 特别 指出 的 是 , 采用 动态 规划 求解 问题 时 的 动态 规划 式 并 不 是 唯一 的 。 这 
与 如 何 设 定子 问题 以 及 如 何 构 建 子 问题 间 的 关系 有 关 。 比 如 , 拾 捡 硬币 还 可 以 假设 
collect_coins[i] 为 第 0 个 到 第 i 个 硬币 的 最 优 解 ， 那么 得 : 

















collect_coins(i) = max(cli] + collect_coins[j];<;_2) (9.3) 


此 时 ,由 于 ;是 子 问题 最 优 解 的 索引 ， 因 此 子 问 题 collect_coins(i) 的 解 应 该 等 于 子 
问题 collect_coins[j] 的 解 加 上 第 i 个 硬币 面值 ci]。 然而 , 满足 要 求 的 7 不止 一 个 。 对 于 
所 有 可 能 符合 要 求 的 j, 即 j < i 一 2 均 需 要 依次 计算 , 其 中 最 大 值 对 应 的 索引 就 是 符合 
要 求 的 j。 读者 可 以 根据 以 上 递归 式 完 成 程序 设计 ,并 验证 算法 的 正确 性 。 


9.3.2 ”连续 子 序列 和 的 最 大 值 

在 6.2 节 介绍 了 利用 分 治 算法 求解 股票 买卖 问题 , 并 且 已 经 知道 这 个 问题 可 以 转化 
为 求 连续 子 序列 和 的 最 大 值 问题 。 如 股票 价格 为 [10,11,7,10,6], 那么 前 后 两 日 的 收益 
差 值 为 [1, 一 4,3, 一 各。 原 问题 就 变换 成 给 定 一 个 序列 , 找 出 其 中 连续 累加 值 最 大 的 子 序 
列 , 序列 [1, 一 4,3, 一 和 中 [3] = 3 即 为 连续 累加 值 最 大 的 子 序列 , 意味 着 在 股票 价格 为 了 
的 时 候 买 入 , 股价 为 10 的 时 候 卖 出 将 获得 最 佳 收益 , 收益 值 为 3。 

当 给 定 n 个 元 素 的 序列 A, 求 和 最 大 的 连续 子 序 列 时 , 输入 序列 元 素 必须 包含 负 值 
才 有 意义 。 否则 当 输 入 序列 均 为 正 值 , 那么 连续 子 序 列 和 最 大 的 就 是 原 序 列 本 身 。 

该 问题 最 简单 的 算法 就 是 穷 举 给 定 序列 的 所 有 子 序列 , 然后 求 得 子 序列 累加 和 的 最 
大 值 。 对 于 有 个 元 素 的 序列 , 其 所 有 连续 子 序列 的 个 数 为 n?。 该 问题 也 可 以 用 分 治 法 
来 求解 , 读者 也 可 以 参考 6.2 节 设 计 一 个 分 治 算法 来 求解 该 问题 , 分 治 算法 的 时 间 复 杂 
度 为 O(nlogn)。 下 面 将 根据 动态 规划 求解 问题 的 基本 步骤 , 介绍 时 间 复 杂 度 为 O(n) 的 
算法 。 

定义 子 问题 

该 问题 输入 的 是 一 个 有 n 个 元 素 的 序列 A, 与 上 一 节 类 似 不 妨 设 P(i) 为 直到 第 i 
个 元 素 的 最 大 和 ,也 就 是 将 输入 序列 的 前 组 作为 子 问题 。 每 一 个 元 素 就 对 应 一 个 子 问题 ， 
子 问题 的 个 数 为 8(m)。 


猜测 解 
对 于 子 问 题 P(i), 考察 元 素 A 四 =-5, 如 图 9.6 所 示 。 该 元 素 要 么 在 子 问题 的 解 中 ， 
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要 么 不 在 , 也 就 是 : 


。 子 问题 P(i) 的 解 包括 第 i 个 元 素 , 如 图 9.6 第 2 行 所 示 。 此 时 有 P(i)=P(i 一 


1) 十 A[i]; 


。 子 问题 P(i) 的 解 不 包括 第 i 个 元 素 , 如 图 9.6 第 3 行 所 示 。 意味 着 需要 从 第 i 个 


元 素 开始 重新 计算 值 , 即 P(G)=A 国 。 


OOOOOA 
© OOO 
OOOO® 


图 9.6 猜测 解 





子 问题 之 间 的 递归 关系 
根据 以 上 分 析 , 可 以 建立 子 问题 间 的 递归 关系 如 下 : 


P(i) = max{P(i— 1)+ Ali,Al]} 


初始 条 件 为 
P(0) =0 


(9.4) 


这 个 递归 式 与 之 前 拾 捡 硬币 问题 的 递归 式 类 似 ， 都 是 当前 子 问 题 的 解 只 与 已 经 求 得 


解 的 子 问题 有 关 , 也 就 是 递归 求解 的 过 程 满足 拓扑 排序 。 
自 底 向 上 构造 动态 规划 表 


对 于 每 一 个 子 问题 的 解 ， 由 于 只 与 已 经 求 出 的 子 问题 解 有 关 。 也 就 是 说 , 如 果 将 各 


个 子 问 题 间 的 关系 画 成 图 , 求解 该 问题 的 过 程 就 相当 于 在 图 上 做 拓扑 排序 。 
自 底 向 上 实现 的 递归 关系 ， 见 代码 9.5。 


代码 9.5 自 底 向 上 实现 子 序列 和 最 大 值 的 递归 策略 





因此 , 可 得 





def bottom_up_cont_subseq(alist): 
table = [None] * (len(alist) + 1) 
table[0] = 0 
for i in range(1, len(alist)+1): 
table[i] = max(table[i-1] + alist[i-1], alist[i-1]) 
return table 
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代码 9.5 首先 声明 一 个 表格 table 用 于 记录 子 问题 的 解 , table 就 相当 于 递归 式 中 的 
P。 然后， 从 第 1 个 元 素 开始 索引 , 按照 递归 关系 求 得 每 一 个 子 问题 的 解 。 

以 输入 序列 A=[ 一 2, 11, 一 4, 13, 一 5, 2] 为 例 , 那么 按照 代码 9.5 得 到 的 动态 规划 表 见 
表 9.2。 以 i = 2 为 例 , 该 单元 格 的 值 要 么 等 于 A[2]=11, 要 么 等 于 A[2]+table[1]=9。 
table[2] 应 该 取 这 两 者 中 的 最 大 值 , 即 table[2]=11。 

表 9.2 中 table 单元 格 内 的 最 大 值 20 即 为 序列 A 中 连续 子 序列 和 的 最 大 值 ， 也 就 
是 P(n)=20。 代码 9.5 有 一 个 次 数 为 n 循环 , 循环 内 部 比较 两 个 值 的 时 间 复 杂 度 为 常数 。 
因此 , 根据 动态 规划 求解 连续 子 序列 和 的 算法 时 间 复 杂 度 为 O(n)。 








表 9.2 自 底 向 上 方法 得 到 的 表格 值 列 表 








i 0 2 3 4 5 6 
table[i] 0 一 2 11 7 20 15 17 
原始 问题 的 解 


在 求 得 动态 规划 表 以 后 , 可 得 最 优 解 为 max(P)=20。 如 果 还 需要 返回 具体 的 最 优 序 
列 [11, 一 4,13], 同样 可 以 由 回溯 法 得 到 该 序列 , 实现 见 代 码 9.6。 

代码 9.6 中 , 首先 得 到 table 中 最 大 元 素 位 置 , 然后 从 这 个 位 置 开始 依次 找到 其 “ 父 
结 点 ”， 也 就 是 确定 当前 元 素 的 值 是 由 它 左 边 的 哪个 子 问 题 得 到 。 由 于 每 一 个 table 元 素 
的 父 结 点 只 有 两 种 可 能 ， 因此 只 需 做 一 次 判断 就 可 以 确定 当前 元 素 的 父 结 点 。 


代码 9.6 ”回溯 得 到 子 序列 和 最 大 问题 的 最 优 解 


def track_back_subseq(alist, table): 
import numpy as np # numpy 是 python 中 常用 的 数学 库 
select = [] 
max_sum = max(table) 
ind_max = np.argmax (table) # 得 到 table 中 最 大 值 索引 
While ind max >= 1: 
if table[ind max] == alist[ind max-1]+table[ind_max-1]: 
select.append(alist[ind max-1]) 
ind_max -= 1 
else: 
select.append(alist[ind max-1]) 
break 


return select 





9.3.3 ”疯狂 的 8 


计算 机 安装 微软 Windows 操作 系统 的 读者 , 对 其 中 一 款 叫 空中 接龙 的 游戏 一 定 不 
陌生 。 游戏 中 有 4 共 扑 克 , 系统 随机 给 出 一 张 扑 克 ci], 玩家 确定 将 这 张 扑 克 放 置 于 4 者 
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扑克 中 的 哪 一 破 。 如 果 当 前 扑克 ci] 与 当前 者 中 的 扑克 cj] 配对 ,那么 该 三 扑 克 从 cj] 
到 c[j] 之 间 的 扑克 将 被 系统 收 走 , 玩家 的 目标 就 是 尽 可 能 消减 这 4 县 扑克 的 数量 。 


og 
如 


7 7, 
二 v9 Sy 9 
4 ve vv 
A a as 


图 9.7 输入 序列 


9 


本 节 的 问题 与 空中 接龙 游戏 类 似 ， 都 是 扑克 匹配 问题 。 给 定 一 个 扑克 序列 clo]， 
co, …, cfn 一 可 《如 图 9.7 所 示 )， 要 求 找 出 最 长 的 配对 子 序列 fa],，.…, cfi], 其 中 
计 < 入 < … < 认 。 如 果 两 张 扑 克 cb] 和 clij41] 配对 ,意味 以 下 之 一 条 件 必须 满足 

。 这 两 张 扑 克 有 相同 的 面值 

。 这 两 张 扑 克 有 相同 的 花色 

。 其 中 一 张 面值 是 8 

如 果 以 上 条 件 满足 ,就 称 这 两 张 扑 克 配对 , 记 为 c[ij]~ clij44]。 图 9.7 所 示 的 输入 序 
列 对 应 的 最 长 配对 子 序列 就 是 clol, c[2], c[3], c[4] 这 四 张 扑克 。 我 们 将 这 个 问题 称 为 疯狂 
的 8， 因为 面值 为 8 的 扑克 最 为 特殊 , 可 以 与 其 他 任何 牌 面 配对 。 

疯狂 的 8 是 一 个 优化 问题 。 可 以 利用 穷 举 法 列 出 n 张 扑克 的 所 有 子 序列 ， 然 后 选 出 
其 中 最 长 的 配对 子 序 列 。 但 是 , 由 于 得 到 n 张 扑克 子 序列 是 指数 时 间 复杂 度 ， 因 此 我 们 
寻求 通过 动态 规划 来 得 到 一 个 更 为 高 效 的 算法 。 

定义 子 问题 

假如 有 一 个 函数 trick( ) 可 以 求解 从 clo] 直到 c 团 间 的 最 长 配对 子 序列 ， 即 从 扑克 
clo] 直到 cli] 最 长 配对 子 序列 可 由 trick(c[:]) 计算 。 与 连续 子 序列 和 问题 类 似 , 都 是 将 
输入 序列 的 前 级 作为 子 问题 。 由 于 0 < i< n, 因此 子 问题 的 个 数 为 @(n)。 


猜 部 分 解 

图 9.8 中 能 与 扑克 c 国 配对 的 是 哪 张 扑克 ? 不 妨 猜测 是 来 自 某 张 扑克 7 其 中 
j= 二 0,1,2,… ,i 一 1。 ci 与 c[j] 这 两 张 扑克 可 配对 , 我 们 用 ci]~ ecD] 来 表示 配对 关系 。 
1 于 是 猜测 ， 因 此 满足 条 件 的 c[j] 可 能 不 止 一 张 , 那 就 将 所 有 可 能 的 7 都 计算 出 来 , 然 
后 取 满足 条 件 的 那个 。 到 底 哪个 7 能 满足 条 件 呢 ? 显然 应 该 选择 这 些 能 与 cli] 配对 中 
trick 值 最 大 的 那 张 扑克 ， 即 如 图 9.8 虚线 所 对 应 的 扑克 。 


























图 9.8 trick 求解 示意 图 


1 


2 
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建立 递归 关系 
根据 以 上 分 析 , 不 难得 到 如 下 递归 式 : 


trick(i) = max[1 + trick(j);<i,cfi~el)] (9.5) 


在 构建 递归 关系 时 , 我 们 也 可 以 这 样 考虑 。 第 一 张 扑克 的 trick(0)=1 (边界 条 件 )， 
第 二 张 扑 克 如 果 可 以 与 第 一 张 扑 克 配 对 ， 则 有 trick(1)=trick(0)+1， 和 否则 trick(1) = 1。 
第 三 张 扑 克 的 trick 值 需要 考虑 前 两 张 扑 克 能 否 与 它 配 对 , 对 于 不 能 与 c[2] 配对 的 扑克 
不 需要 考虑 ,因为 对 c[2] 的 计算 没有 贡献 。 如 果 只 有 一 张 能 与 c[2] 配对 ， 如 是 c[1]， 那 
么 c[2] = c[ 上 +1。 如 果 前 两 张 都 能 与 c[2] 配对 , 那么 选择 前 两 张 中 trick 值 最 大 的 与 c[2] 
配对 。 
自 底 向 上 实现 递归 
通过 式 (9.5), 可 以 求 出 所 有 张 扑 克 对 应 的 trick 值 , 最 大 trick 值 就 是 最 长 配对 子 
序列 的 长 度 。 式 (9.5) 是 一 个 典型 的 递归 函数 , 求解 前 i 张 扑克 问题 的 解 时 , 需要 知道 前 
i 一 1,i 一 2,… ,0 张 扑克 问题 的 解 。 这 意味 着 递归 式 9.5 的 求解 满足 拓扑 排序 ,可 以 通过 
自 底 向 上 的 方法 来 实现 。 以 图 9.7 的 输入 为 例 , 可 得 到 如 表 9.3 所 示 的 一 维 动 态 规划 表 。 
表 9.3 疯狂 的 8 的 动态 规划 表 
i 0 1 2 3 4 
trick[ 1 2 2 本 4 





同时 , 式 (9.5) 也 表明 存在 许多 重复 的 子 问 题 。 如 在 求 第 i 和 第 i 一 1 张 扑 克 问 题 的 
解 时 , i 一 2,… ,0 分 别 被 求 了 两 次 。 因 此, 通过 自 底 向 上 实现 递归 可 以 提高 算法 效率 ， 
实现 见 代 人 码 9.7。 


代码 9.7 自 底 向 上 求解 疯狂 的 8 


import numpy as np 
def crazy_eight (cards): 
trick = {} 
parent = 人 
trick[0] = 1 
parent [0] = None 
for i, ci in enumerate(cards): 
tem_trick = [] 
FE: 二 
for j, cj in enumerate(cards[:i]): 
1 Isp.trick(el, cel): 
tem_trick.append(trick[j]) 
else: 


tem_trick.append(0) 
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15 max_trick = max(tem_trick) 

16 trick[i] = it+max_trick 

17 ind_max = np.argmax(tem_trick) 
18 if is_trick(ci,cards[ind_max]): 
19 Parent[i] = ind_max 

20 else: 

21 parent[i] = None 

22 return trick, parent 





代码 9.7 中 第 7 行 遍历 所 有 扑克 , 第 10 行 的 循环 遍历 第 一 张 扑 克 直 到 当前 第 i 张 
扑克 ， 即 c[: ij。 循 环 变量 经 由 enumerate( ) 函数 (第 10 行 ) 遍历 序列 中 的 元 素 以 及 它 
们 的 索引 。 因 此, 循环 索引 可 以 用 两 个 变量 i, cj， 它 们 分 别 表 示 扑 克 的 下 标 和 扑克 的 
值 。trick 是 字典 类 型 变量 , 它 的 key 是 参数 索引 i,key 对 应 的 值 为 从 0 到 i 的 最 长 扑 
克 配 对 数 。 代 码 9.7 第 11 行 调用 函数 is_trick( ) ( 见 代码 9.8), 用 于 判断 两 张 扑克 是 否 
配对 。 


代码 9.8 判断 两 张 扑 克 是 否 匹配 


def is_trick(ci, c2): 

if cl[0] == c2[0]: 
return True 

elif ci[1] == c2[1] : 
return True 

elif cl[0] == '8' or c2[0]=='8': 
return True 

else: 


oo oo nn aw Nr 


return False 


代码 9.7 中 , 第 10 行 一 第 14 行 求解 每 一 个 子 问 题 , 也 就 是 尝试 每 一 个 猜测 ， 最 后 
选择 其 中 的 最 大 值 作为 当前 trick 的 值 。 每 一 个 子 问题 的 求解 时 间 复 杂 度 为 O(n), 共有 
O(n) 个 子 问题 。 因此 , 代码 9.7 的 时 间 复 杂 度 为 O(n2)。 

为 了 测试 算法 , 需要 随机 产生 n 张 扑克 ， 其 实现 见 代 码 9.9。 变 量 SUITS 为 扑 
克 的 四 种 花色 RANKS 则 表示 扑克 的 十 三 种 牌 面值 。 代 码 9.9 第 7 行 中 通过 函数 
itertools.product 实现 RANKS 和 SUITS 的 笛 卡 尔 积 〈( 直 积 )， 也 就 是 从 RANKS 中 
依次 取出 一 个 牌 面值 与 SUITS 中 的 四 个 花色 组 成 序 对 存储 于 变量 card。 通过 .join 对 
序 对 添加 引号 。 第 8 行将 生成 的 扑克 序列 进行 随机 的 洗 牌 。 如 果 n = 10, 那么 函数 
generate_cards( ) 的 输出 就 是 形 如 ['3d', 'Jc', '8h', '3c', '3h', '6s', 'Ke', 'As', '4c', 'Kd1] 
的 输出 结果 。 




















代码 9.9 随机 产生 扑克 





1 # 随机 产生 nn 张 扑克 


2 def generate_cards(n) : 


oo om wo nm aw 


mo nw Np 


第 9 章 动态 规划 算法 161 





import random 

import itertools 

SUITS = 'cdhs' # 四 种 花色 

RANKS = '23456789TJQKA' # 十 三 种 面值 

DECK = tuple(' '.join(card) for card in itertools.product(RANKS，SUITS)) 
hand = random.sample(DECK, n) 


return hand 





代码 9.9 中 函数 generate_cards( ) 只 考虑 了 随机 生成 n 张 扑 克 , 而 没有 考虑 生成 n 
副 扑 克 。 读者 可 以 考虑 修改 该 函数 , 让 它 的 输出 是 n 副 扑 克 。 其中, 1 副 扑 克 有 54 张 
扑克 。 


得 到 原 问 题 的 解 

原 问 题 的 解 即 为 表格 trick 中 取 最 大 值 。 如 果 还 需要 返回 具体 是 哪 几 张 扑 克 , 就 需要 
在 填 表 时 增加 每 一 个 表格 的 父 结 点 这 一 信息 , 父 结 点 就 是 使 得 trick[i] 取 最 大 值 的 某 一 
个 具体 的 7。 代码 9.7 第 18 行 一 第 21 行 实现 了 填写 父 结 点 的 内 容 , 父 结 点 信息 存储 于 
字典 parent 变量 中 。 

代码 9.10 中 的 函数 get_longest_subsequence( ) 根据 parent 返回 最 长 配对 的 扑克 。 
第 2 行 首先 找到 字典 trick 中 值 最 大 值 对 应 的 关键 字 , 然后 将 该 关键 字 对 应 的 扑克 存储 
于 列表 变量 subsequence 中 。 第 6 行 根据 parent 记录 的 父 结 点 信息 , 找到 下 一 张 配对 扑 
克 索 引 。 


代码 9.10 得 到 疯狂 的 8 的 问题 解 


def get_longest_subsequence(cards, trick, parent): 
ind_max = max(trick.keys(), key=(lambda key: trick[key])) 
subsequence = [] 
while ind_max is not None: 
subsequence.append(cards [ind_max]) 
ind_max = parent [ind_max] 
subsequence.reverse() 


return subsequence 





9.3.4 ”文本 排版 


现代 办 公 离 不 开 文字 处 理 软件 ,如 金山 WPS、 微 软 的 Word 或 者 是 Latex 等 , 这 些 
软件 都 能 将 键入 的 单词 进行 合理 排版 , 得 到 一 份 非常 漂亮 的 文档 。 给 定 一 组 单词 和 页 面 
宽度 , 这些 排 版 软件 能 将 单词 合理 排 在 每 一 行 ， 从 而 得 到 “美观 ”排版 结果 。 本 节 将 介绍 
动态 规划 算法 如 何 解决 文字 排版 的 问题 。 

输入 是 个 单词 和 页 面 宽 度 w, 输出 是 每 一 行 词 的 分 布 。 排 版 单词 时 ， 要 求 不 改变 
各 单词 原来 顺序 ， 且 页 面 每 一 行 各 个 单词 累加 的 长 度 不 能 超过 页 面 宽度 。 
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在 解决 以 上 问题 之 前 , 需要 先 定义 什么 是 “美观 ”的 排版 。 直观 来 说 , 一 行文 字 如 果 
空格 很 多 , 那么 这 行 就 不 是 一 个 美观 的 排版 。 因此 , 通过 变量 badness 来 量化 一 行 的 难 
看 程度 





二 号 0 (9.6) 
(wp 一 wl?”， 其 他 

其 中 ，wl 表示 第 i 个 词 到 第 j 个 词 的 累加 宽度 ,wp 是 页 面 宽度 。 假 如， 页面 
宽度 wp = 20， 有 4 个 单词 序列 [panda, panda, panda,， panda]， 各 个 单词 有 5 个 
字母 ， 其 宽度 均 设 为 ww = 5。 那 么 ， 当 一 行 中 只 有 前 2 个 单词 时 ，badness(1, 2) 
= (20 一 (5 十 5))? = 1000; 而 一 行 中 有 输入 序列 的 前 3 个 单词 时 ，badness(1, 3) = 
(20 一 (5 十 5 十 5))3 = 125。 也 就 是 说 , 一 行 中 只 排版 了 两 个 单词 的 话 , 我 们 用 1000 来 表 
示 其 难看 程度 。 如 果 该 行 排 了 3 个 单词 , 那么 其 难看 程度 是 125。 这 表明 该 行 排 3 个 单 
词 比 排 2 个 单词 要 美观 , 这 是 因为 排 3 个 单词 时 页 面 的 空白 处 相 比 较 于 排 2 个 单词 的 空 
白 要 小 。badness 函数 中 wp 一 wl 取 立 方 , 是 为 了 增加 wp 一 wl 的 差异 值 , 即 凸 显 一 行 
中 空白 的 不 美观 度 。 

有 了 以 上 量化 函数 , 问题 就 变 成 求 得 一 种 排版 结果 ,使 得 badness 的 值 最 小 。 显然 ， 
这 是 一 个 优化 问题 。 对 于 优化 问题 , 可 以 首先 尝试 采用 “贪心 ”算法 进行 求解 , 即 从 nn 个 
输入 单词 中 选择 前 面 的 个 词 “ 美 观 ” 的 排 在 第 一 行 , 然后 依次 将 所 有 的 词 排 列 于 各 行 。 
但 是 , 用 贪心 算法 来 求解 该 问题 , 尽管 前 面 各 行 “ 美 观 ”的 排 在 了 一 行 , 但 并 不 能 总 体 
上 保证 所 有 的 行 都 排 的 很 美观 。 比 如 ,word[0] = 'panda', word[1] = 'panda', word[2] = 
'panda', word[3] = 'panda', word[ = 'reallongwordsfor'。 页 面 宽 度 pw = 16。 

按照 贪心 算法 , 应 该 将 前 3 个 词 排 在 第 一 行 , 这 对 第 一 行 而 言 是 最 美观 的 排版 。 但 
是 , 第 二 行 就 只 能 排 下 第 4 个 词 , 第 5 个 词 排 在 第 3 行 。 对 第 二 行 而 言 , 显然 其 排版 结 
果 非 常 不 美观 。 按照 贪心 算法 其 排版 结果 如 图 9.9 的 左 图。 同样 这 些 单词 , 一 个 更 为 美 
观 的 排版 应 该 如 图 9.9 的 右 图 。 显然 , 对 于 这 种 排版 方式 第 一 行 并 不 是 最 优 排版 结果 , 但 
排 完 所 有 单词 后 总 体 排版 结果 是 最 美观 的 。 读者 可 以 根据 式 (9.6) 分 别 求 出 图 9.9 各 自 
的 badness， 从 而 验证 哪 种 排版 是 更 为 美观 的 排版 结果 。 



































panda panda panda panda panda 

panda panda panda 

reallongwordsfor reallongwordsfor 
贪心 算法 排版 更 为 合理 的 排版 


图 9.9 排版 结果 比较 


定义 子 问 题 
首先 定义 子 问题 ， 由 于 输入 的 是 单词 序列 , 那么 不 妨 设 words[:i] 为 子 问题 ， 也 就 是 
输入 序列 的 前 缀 作为 子 问 题 。 将 这 些 单词 的 badness 记 为 DP[], 这 里 的 DP 与 本 章 前 几 
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节 定 义 子 问题 的 函数 类 似 , 都 表示 一 维 动态 规划 表 。 由 于 i 可 以 取 0 到 之 间 的 值 , 因 
此 共有 mn 个 子 问 题 。 

猜 部 分 解 

在 定义 了 子 问 题 后 , 就 需要 建立 子 问题 间 的 递归 关系 , 为 此 , 考察 子 问题 的 解 DP[i]， 
显然 子 问题 最 为 特殊 的 就 是 最 后 一 行 。 也 就 是 说 , 与 单词 i 在 同一 行 的 词 应 该 在 什么 地 
方 切 分 。 

如 图 9.10, 这 时 不 妨 猜测 第 j 个 单词 与 词 i 为 同一 行 。 然而 , 这 个 猜测 并 不 一 定 准 
确 , 单词 7 究竟 是 哪 一 个 并 不 能 确定 。 单 词 了 的 范围 我 们 知道 应 该 是 第 0 个 单词 到 第 
i 一 1 个 单词 之 间 的 某 一 个 。 因此 , 既然 不 能 确定 7 究竟 是 哪 一 个 , 那 就 将 它 所 有 可 能 的 
范围 都 计算 一 遍 。 其 中 , 让 值 DP[i] 取 最 小 值 的 7 就 应 该 是 与 i 同一 行 的 第 一 个 单词 。 








子 问题 的 解 : dp[i] 


r- 上 | 
| GB 
= 下 


dp[7-]] badness(7 


图 9.10 子 问题 解 之 间 关 系 
根据 以 上 分 析 , 可 以 得 到 子 问题 间 的 递归 式 : 
DP[i] = min{badness(j,i) + DP[; 一 1joci<i (9.7) 
当 没 有 单词 时 , 排版 的 badness 应 该 等 于 0。 因此 , 边界 条 件 DP[--1] = 0。 


自 底 向 上 求解 递归 式 

按照 递归 式 (9.7), 可 以 很 容易 地 将 上 式 按 照 自 底 向 上 的 方式 实现 ， 见 代码 9.11。 代 
码 第 2 行将 输入 单词 序列 按照 空格 提取 每 一 个 单词 的 长 度 , 将 长 度 值 存储 于 变量 words。 
代码 9.11 第 6 行 的 循环 遍历 每 一 个 单词 ， 第 8 行内 循环 遍历 第 一 个 单词 到 当前 单词 。 变 
量 tem_sum 存储 内 循环 中 各 个 了 对 应 的 DP 值 。 

从 该 实现 可 以 看 出 算法 共有 nn 个 子 问题 , 每 一 个 子 问题 的 执行 时 间 是 O(n)。 因 此 ， 
代码 9.11 的 时 间 复 杂 度 为 O(n?)。 





代码 9.11 文字 排版 的 动态 规划 算法 





def text_ justification(text, pw): 
words = [len(word) for word in text.split()] 


len words = len(words) 


DP = {} 


164 算法 设计 与 分 析 (Python) 





DP[0] = 0 # 边界 条 件 
for i in range(1,len words+1): 
tem sum = [] 
for j, wj in enumerate(words[:i]): 
badness = (pw - sum(words[j:i]))**3 
if badness < 0: # 越界 
badness = float ("inf") 
tem_ sum.append(DP[j] + badness) 
DP[i] = min(tem sum) 


return DP 





为 了 让 读者 更 容易 理解 递归 式 (9.7), 下 面 将 通过 一 个 实例 来 详细 说 明 如 何 求解 
DP 国 以 及 如 何 利用 该 表 划 分 单词 . 假设 有 5 个 单词 的 输入 序列 , 分 别 是 word[0] = 
‘panda', word[1] = 'panda', word[2] = 'panda', word[3] = 'panda', word[d] = 'reallong- 
wordsfor'。 各 单词 长 度 分 别 为 ww[0] = ww[1] = ww[2] = ww[3] = 5, ww[4] = 15。 其 中 ， 
页 面 宽度 pw = 16。 

根据 代码 9.11, 我 们 分 别 计算 各 个 子 问题 的 DP 值 , 然后 看 最 终 的 排版 结果 是 否 是 
如 图 9.9 的 右 图 所 示 的 结果 。 

当 只 有 第 一 个 单词 时 , 按照 递归 式 有 DP[0] = DP[-1] + (pw 一 ww[0])3 = 0+(16 一 5)3 
= 1331。 

当 有 单词 序列 的 前 两 个 单词 时 ，DP[I] 要 么 等 于 DP[--1]+(pw 一 ww[0] 一 ww[1])3= 
0+216= 216, 或 者 DP[0]+(pw 一 ww[1])?=1331+1331=2662。 显 然 , 两 者 取 小 的 赋值 给 
DP[1] = 216。 

单词 序列 为 前 三 个 单词 时 , DP[2] 的 计算 需要 考虑 以 下 三 种 情况 : 

es。 DP[2] = DP[-1]+(pw—wwl[0]—ww[l]—ww[2]))3 = 0+1=1 

®。 DP[2] = DP[0]+(pw—ww[l]—ww[2])? = 1331 + 216 = 1647 
®。 DP[2] = DP[1]+(pw—ww[2])? = 216 + 1331 = 1647 

上 述 三 种 情况 取 最 小 值 的 话 , 可 得 DP[2] = 1。 

单词 序列 为 前 四 个 单词 时 , DP[3] 的 计算 需要 考虑 以 下 四 种 情况 : 

。 DP[3] = DP[-1]+(pw—ww[0]—ww[1]-ww[2]ww[3])? = 0 十 oo = co, 单词 总 长 
度 超出 了 页 面 宽度 

。 DP[3] = DP[0]+(pw—wwl[l]—ww[2]—ww[3])? = 1331 + 1 = 1332 

。 DP[3] = DP[1]+(pw—ww[2]—ww[3])? = 216 + 216 = 432 

。 DP[3] = DP[2]+(pw—ww[3])? = 1 + 1131 = 1332 

上 述 四 种 情况 取 最 小 值 的 话 , 可 得 DP[3] = 432。 

单词 序列 为 前 五 个 单词 时 , DP[4] 的 计算 需要 考虑 以 下 五 种 情况 : 

。 DPI 四 = DP[-1]+(pw—wwl0]—wwll]—ww[2]-ww[3]-wwl4])? = 0 二 oo = 00, 单 
词 总 长 度 超 出 了 页 面 宽度 
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。 DP[I4] = DP[0]+(pw—wwll]—ww[2]-ww[3] 一 ww[4)? = 1331 十 co = co,， 单词 总 














长 度 超出 了 页 面 宽度 
。DP[4] = DP[1]+(pw 一 ww[2] 一 ww[3] 一 ww 可 )3 = 216 十 oo = co, 单词 总 长 度 超出 
了 页 面 宽度 





。DP[4] = DP[2]+(pw 一 ww[3] 一 ww 团 )3 = 1 十 oo = co, 单词 总 长 度 超出 了 页 面 宽度 

。 DP[4] = DP[3]+(pw—ww[4])? = 432 + 1 = 433 

上 述 五 种 情况 取 最 小 值 的 话 , 可 得 DP[4] = 433。 

有 了 以 上 各 个 子 问 题 的 值 之 后 , 便 可 知 如 何 划 分 单词 。 为 了 便于 说 明 , 我 们 将 以 上 
的 计算 过 程 用 图 9.11 表示 出 来 。 其 中 , 通过 表格 下 面 的 线段 表示 每 一 个 子 问题 的 值 来 自 
于 前 面 的 哪个 子 问 题 , 也 就 是 如 何 划 分 单词 到 每 一 行 。 图 9.11 中 的 虚线 表示 切 分 位 置 ， 
也 就 是 词 word[0] 和 word[1] 置 于 一 行 , word[2] 和 word[3] 置 于 一 行 , word[4] 置 于 一 行 。 
因此 , 通过 动态 规划 得 到 了 一 个 优化 的 排版 结果 。 











DP 





图 9.11 排版 问题 的 动态 规划 表 


代码 9.11 仅仅 计算 了 输入 单词 序列 的 动态 规划 表 的 值 , 并 没有 给 出 按照 动态 规划 算 
法 得 到 的 切 分 结果 。 读 者 可 以 修改 代码 9.11， 从 DP 表 每 一 个 单元 的 指向 关系 得 到 每 一 
行 单词 的 排版 结果 。 


9.3.5 ”完全 信息 的 21 点 


21 点 是 又 名 黑 杰 克 (Black Jack)， 起源 于 法 国 , 是 世界 各 地 赌场 最 为 流行 的 游戏 之 
一 。 游 戏 中 有 两 个 角色 , 分 别 是 庄家 和 玩家 。 庄家 一 般 是 1 位 , 而 玩家 人 数 则 不 限 。 为 了 
描述 方便 , 我 们 假设 只 有 1 位 玩家 。 庄 家 先 给 玩家 发 两 张 牌 ， 再 给 自己 发 两 张 牌 。 大 家 
手中 扑克 点 数 的 计算 是 : K、Q 和 了 丁 牌 都 算 作 10 点 。A 牌 既 可 算 作 1 点 也 可 算 作 11 点 ， 
玩家 自己 决定 , 其余 所 有 2 至 9 均 按 其 原 面 值 计 算 。 根 据 手 上 已 有 的 两 张 扑 克 ， 玩 家 
开始 要 牌 。 玩 家 可 以 随意 要 多 少 张 , 目的 是 让 手 上 扑克 总 数 尽 量 等 于 21 点 , 但 不 能 超过 
21 点 。 一 旦 所 有 的 牌 面值 累加 起 来 超过 21 点 , 这 种 状况 称 为 爆 掉 (Bust)。 假 如 玩家 没 
爆 掉 ， 又 决定 不 再 要 牌 了 , 这 时 庄家 按照 固定 的 策略 要 牌 。 其 策略 是 : 如 果 庄 家 所 有 上牌 面 
点 数 不 到 17, 他 就 一 直 要 牌 ; 直到 他 所 有 牌 面 点 数 超 过 (包括 ) 17 点 , 则 停止 要 有 牌 。 最 
后 , 庄家 和 玩家 相互 比较 手 上 牌 的 总 点 数 , 点 数 大 的 胜 。 游戏 过 程 中 , 只 要 有 一 方 的 牌 面 
总 点 数 爆 掉 ， 就 判 输 ， 并 开始 新 的 一 局 。 
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假如 现在 只 有 两 人 在 玩 这 个 游戏 , 一 个 是 庄家 , 另 一 个 是 玩家 。 我 们 需要 编写 一 个 
软件 来 帮助 玩家 与 庄家 对 战 ， 从 而 使 得 玩家 在 多 次 对 局 中 的 总 收益 最 大 。 假 定 获胜 一 次 
赢得 1 元 奖励 , 输 的 一 方 失去 1 元 , 相同 分 数 意 味 着 平局 , 平局 即 没 钱 进 也 不 出 钱 。 我 
们 还 假设 , 为 了 赢得 这 个 游戏 ,玩家 戴 了 一 个 特殊 的 X 射线 眼镜 ,他 可 以 看 到 庄家 未 发 
的 整 副 扑克 的 点 数 ， 即 


Cos C1ly ,Cn—1 


当 将 桌面 上 的 扑克 序列 作为 输入 传 给 软件 ,软件 需要 提供 给 玩家 的 就 是 帮助 其 决 
策 , 即 连 续 要 几 张 牌 或 不 要 牌 。 由 于 所 有 扑克 牌 面 均 已 知 , 且 庄 家 的 策略 固定 , 因此 玩家 
在 每 一 局 的 策略 不 仅 会 决定 当前 局 次 的 收益 , 而 且 对 后 面 局 次 收益 有 直接 影响 。 这 意味 
着 玩家 为 了 获取 最 大 的 总 收益 , 可 能 会 故意 输 掉 其 中 的 一 些 局 次 , 为 的 是 在 此 后 局 次 中 
获得 更 多 收益 。 

以 上 问题 显然 是 一 个 优化 问题 , 一 个 简单 的 想法 就 是 把 所 有 可 能 的 牌 面 分 布 穷 举 
出 来 , 然后 选择 一 个 最 佳 的 收益 路 线 。 可 以 通过 构造 一 棵 策略 树 来 穷 举 所 有 的 解 ( 如 
图 9.12)。 树 的 根 结 点 就 是 n 张 扑 克 ， 此 时 玩家 收益 为 0。 根 结 点 下 有 若干 个 子 结 点 ， 分 
别 表示 只 要 1,2,… ,大 张 牌 后 该 局 的 收益 , 大 为 让 玩家 爆 掉 的 要 牌 数 。 树 的 第 三 层 则 是 
在 第 一 局 结束 后 , 进行 第 二 局 时 玩家 要 1,2,…… , 必 张 牌 后 该 局 的 收益 。 其 中 , Kk’ 等 于 让 
玩家 在 第 二 局 爆 掉 的 要 牌 数 。 树 中 每 一 层 表 示 该 局 玩家 不 同 要 牌 数 情况 下 的 收益 。 依 此 
便 可 构造 一 棵 完整 的 收益 树 ， 问 题 的 解 便 是 遍历 从 根 结 点 直到 叶子 结 点 的 每 一 条 路 径 ， 
累加 和 最 大 的 路 径 便 是 玩家 应 该 采用 的 策略 ( 树 上 加 黑 的 边 )。 
































图 9.12 策略 树 


采用 以 上 算法 可 以 求 得 满足 要 求 的 解 , 但 由 于 需要 遍历 策略 树 的 每 一 条 路 径 , 而 树 
中 每 一 层 的 结 点 是 按 指 数 规模 增长 , 这 表明 穷 举 法 是 一 个 非常 低 效 的 算法 。 为 此 , 下 面 
将 寻求 动态 规划 的 解法 ,以 便 得 到 一 个 多 项 式 时 间 的 算法 。 

定义 子 问题 

按照 动态 规划 求解 问题 的 步骤 , 首先 定义 子 问题 。 假设 i 是 剩余 的 扑克 数 ,， BJ(i) 则 
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是 剩余 扑克 为 ci, ct+l, …，cn_i 的 最 佳 收 益 数 。 BJ(i) 就 是 定义 的 子 问题 , 显然 i 的 取 
值 范围 从 0 到 mn, 因此 子 问题 的 个 数 为 n。 在 前 几 节 ,如 果 把 输入 序列 看 作 一 个 串 ， 那么 
其 子 问 题 就 是 这 个 串 的 前 级 。 与 之 前 定义 子 问 题 的 方式 不 同 , 这 次 我 们 将 输入 串 的 后 级 
作为 子 问题 ©。 

猜测 解 

根据 定义 的 子 问题 ,利用 猜测 来 建立 子 问题 间 的 关系 。 由 于 只 有 两 人 对 战 ,而 且 庄 
家 的 策略 已 知 ,那么 唯一 不 确定 的 就 是 玩家 会 要 几 张 牌 。 不妨 猜测 一 下 玩家 抓 了 多 少 张 
扑克 ， 如 果 这 个 值 确定 ,那么 就 可 以 确定 这 一 局 将 用 掉 有 张 牌 。 那 么 , 下 一 局 的 子 问题 
就 变 为 BJ(G 十 有 )。 

这 两 个 子 问题 之 间 的 关系 是 什么 ? BJ(i) 表示 剩余 扑克 为 ci ctHl, ……，cn_i 的 最 佳 
收益 数 , 那么 BJ(i 二 有 ) 表示 剩余 扑克 为 cs+k， Citk+1，,"…， Cn-1 的 最 佳 收益 数 。 它 们 之 
间 的 差异 就 是 局 次 的 收益 , 该 局 次 消耗 的 扑克 为 c; 直到 ci+k。 

根据 以 上 分 析 不 难得 到 子 问题 BJ(i) 的 递归 解 ， 



































BJ(i) = max{[+1,0,—1] + BJ(i+k)}, k=0,1,... (9.8) 


其 中 ,表示 剩余 扑克 为 ci, ci41,…, cn_1 时 该 局 次 使 用 的 牌 数 , 它 的 范围 包括 所 
有 没有 爆 掉 情况 下 玩家 与 庄家 一 起 抓 起 的 扑克 数 。 任意 一 方 的 扑克 点 数 超过 21 点 , 则 该 
局 停止 ， 并 判 该 爆 点 的 一 方 输 。 该 问题 的 边界 条 件 是 当 牌 数 不 足 4 张 时 的 情形 (按照 规 
则 , 庄家 和 玩家 必须 每 人 2 张 底牌 ), 此 时 BJ 的 值 为 0。 

以 上 递归 式 同样 的 可 以 使 用 有 向 无 环 图 来 描述 , 如 图 9.13 所 示 。 图 中 每 一 个 结 点 对 
应 于 一 个 子 问 题 , 图 中 的 边 表示 对 战局 次 收益 。 原 问题 的 解 就 是 从 结 点 0 开始 直到 结 点 
n 一 1, 寻找 一 条 权重 值 累 加 和 最 大 的 路 径 。 从 图 9.13 中 不 难看 出 , 每 一 个 结 点 的 值 只 与 
其 右边 已 经 求解 出 值 的 结 点 有 关 , 因此 按照 该 图 求 得 每 个 结 点 值 的 过 程 相当 于 在 图 上 进 


行 拓扑 排序 。 
0 1 





图 9.13 21 点 游戏 的 有 向 无 环 图 


自 底 向 上 求解 递归 式 
有 了 以 上 分 析 , 不 难得 到 如 代码 9.12 所 示 的 算法 实现 。 简单 来 说 ,代码 9.12 就 
是 按照 递归 式 填写 一 个 1 行 n 列 的 表 bj-table。 函 数 black_jack_iterative( ) 有 一 个 从 





@ 前 几 节 的 问题 也 可 以 使 用 输入 串 的 后 级 作为 子 问题 。 
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n 一 1 到 0 的 循环 , 用 于 索引 bj_table 表 中 每 一 个 单元 格 。 单 元 格 的 值 通过 调用 函数 
black_jack( ) 计算 , 函数 black_jack() 按照 递归 式 计算 每 一 个 单元 格 的 值 。 对 每 一 个 单 

















元 格 , 函数 black_jack( ) 通过 循环 变量 p 索引 玩家 的 抓 牌 数 , 然后 比较 与 庄家 


其 抓 牌 





数 是 固定 的 ) 之 间 的 大 小 关系 , 得 到 的 结果 存储 于 表 options 中 。 在 计算 完 玩家 所 有 抓 牌 





数 的 尝试 后 , 求 出 options 中 的 最 大 值 就 是 bj_table 当前 单元 的 值 。 


代码 9.12 21 点 问题 的 动态 规划 算法 





def black jack iterative(cards): 
global n 
n = len(cards) 
bj_table = {} 
bj-table[n] = 0 
for i in xrange(n-1, -1, -1): 
bj-table[i] = black_jack(i, bj_table) 
return bj_table 


def black_ jack(i,bj_table): 
if n-i < 4:return 0 # 没有 足够 的 扑克 
options = [] 
for p in xrange(0, n-i-3): 
# 玩家 尝试 抓 各 种 数量 的 牌 
player_cards = get_player_cards(cards, i, p) 
player = sum(player_cards) 
if player > 21: 
options.append(-1+bj_table[i+4+p]) 
break 
# 庄家 按照 固定 的 策略 抓 牌 
for d in xrange(0, n-i-p-3): 
dealer_cards = get_dealer_cards(cards, i, p, d) 
dealer = sum(dealer_cards) 
if dealer >=17: break 
if dealer > 21: dealer = 0 
options.append(cmp(player, dealer)+bj_table[i+4+p+d]) 


return max(options) 





代码 9.12 第 6 行 和 第 7 行 有 一 个 O(n) 循环 , 其 中 调用 函数 black_jack() 


用 于 填 


表 , 该 函数 有 一 个 嵌 套 的 循环 , 其 时 间 复 杂 度 为 O(n?)。 因 此 , 整个 算法 的 时 间 复 杂 度 为 


O(n3)。 


代码 9.12 第 15 行 和 第 22 行 分 别 调用 函数 get_player_cards() 和 get_dealer_ 














cards( )， 它 们 分 别 实现 了 为 玩家 和 庄家 从 第 i 位 开始 抓 p 张 牌 的 功能 ， 划 
代码 9.13。 


实现 见 
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代码 9.13 玩家 和 庄家 抓 牌 函数 





# 玩家 第 位 开始 抓 p 张 牌 
def get_player_cards(cards, i, Pp): 
player_cards = [] 
player_cards.append(cards[i]) 
player_cards.append(cards[i+2]) 
for k in xrange(0, p): 
player_cards.append(cards [i+4+k]) 
return player_cards 
# 庄家 第 工 位 开始 抓 P 张 牌 
def get_dealer_cards(cards, i, p, d): 
dealer_cards = [] 
dealer_cards.append(cards [i+1]) 
dealer_cards .append(cards [i+3]) 
for k in xrange(0, d): 
dealer_cards.append(cards [i+4+p+k] ) 
return dealer_cards 


原 问题 的 解 

在 得 到 动态 规划 表 之 后 , 就 可 以 很 容易 得 到 玩家 每 一 局 的 策略 。 从 表 bj-table[o] 开 
始 , 找到 其 父 结 点 ， 也 就 是 确定 玩家 要 牌 的 位 置 。 持 续 根据 结 点 及 其 父 结 点 的 跳 转 关系 ， 
直到 最 后 一 张 扑 克 , 便 能 获得 最 佳 收益 下 玩家 的 策略 。 这 里 需要 强调 的 是 , 通过 动态 规 
划 可 以 在 21 点 这 个 游戏 中 获得 最 佳 收益 , 但 并 不 意味 着 可 以 使 用 这 个 算法 去 征战 赌场 。 
这 是 因为 玩家 获得 最 佳 收益 的 前 提 是 已 经 知道 桌面 所 有 的 扑克 序列 , 实际 的 赌场 中 玩家 
应 该 是 得 不 到 这 个 信息 的 。 


9.4 ”二 维 动态 规划 


上 一 节 从 求 斐 波 那 契 数 问题 开始 , 直到 21 点 游戏 的 各 个 问题 , 都 是 根据 递归 式 填写 
一 维 表 来 实现 求解 每 一 个 子 问题 的 解 。 这 是 因为 每 一 个 子 问题 的 参数 只 有 一 个 , 我 们 将 
子 问题 只 有 一 个 参数 的 动态 规划 问题 称 为 一 维 动态 规划 。 那么 , 如 果子 问题 有 两 个 参数 ， 
得 到 的 将 是 一 张 二 维 动态 规划 表 , 本 节 将 介绍 几 个 经 典 的 二 维 动态 规划 问题 。 





9.4.1 “和 矩阵 的 括号 


对 于 喜欢 科幻 影片 的 同学 , 一 定 记得 1999 年 发 行 的 《黑客 帝国 》 系 列 电影 ， 这 部 电 
影 的 英文 名 是 The Matrix。 本 节 我 们 不 是 讨论 这 部 伟大 科幻 片 的 情节 , 而 是 需要 评价 
Matrix (矩阵 ) 乘法 在 不 同 结合 律 下 的 运算 效率 。 给 定 n 个 窍 阵 A[0], A[1],…, Aln 一 1 
序列 ,由 于 矩阵 乘法 满足 结合 律 , 因此 可 以 通过 在 这 个 矩阵 中 添加 括号 , 来 控制 将 哪 
些 矩 阵 优先 放 在 一 起 进行 运算 。 不同 的 结合 方式 ,完成 矩阵 计算 最 终 的 效率 各 不 相同 。 


170 算法 设计 与 分 析 (Python) 





比如 有 三 个 矩阵 A、B 和 C, A 的 行列 数 为 100 x 1, 矩阵 也 的 行列 数 为 1 x 100， 
和 矩阵 C 的 行列 数 为 100 x 1。 现 需 计 算 这 三 个 矩阵 相 乘 的 结果 ABC, 如 图 9.14(a) 所 示 。 
按照 矩阵 乘法 的 结合 律 可 以 先 将 AB 相 乘 ， 再 将 结果 与 C 相 乘 。 其 运算 过 程 可 以 表示 
成 (AB)C (图 9.14(b))。 还 可 以 按照 图 9.14(c) 的 结合 方式 ，A(BC)。 根据 结合 律 , 这 两 
种 不 同 结合 方式 最 终 的 运算 结果 相同 。 但 是 , 它们 各 自 的 运算 次 数 并 不 一 样 。 先 计算 
AB 产生 了 一 个 100 x 100 大 小 的 矩阵 (图 9.14(b)); 而 先 计 算 BC, 新 产生 的 是 一 个 数 
(图 9.14(c))。 因 此 , 第 一 种 结合 方式 需要 运算 6(1002)， 而 第 二 种 结合 方式 需要 运算 的 
次 数 为 8(100)。 





eC |]e 


A B (e (A B) C A (BC) 


加 | 
(b) 


图 9.14 矩阵 不 同 结合 方式 导致 计算 效率 的 变化 


为 此 , 需要 设计 算法 求 得 给 定 和 矩阵 序列 的 最 优 结 合 方式 。 或 者 说 , 通过 括号 控制 优 
先 级 从 而 得 到 最 少 运算 时 间 的 矩阵 结合 方式 。 这 显然 是 一 个 优化 问题 ,我 们 先 看 能 否 直 
接 给 出 解决 办 法 。 最 简单 直接 的 方法 就 是 穷 举 出 所 有 结合 方式 , 分 别 求 得 每 一 个 结合 方 
式 的 计算 时 间 , 再 从 中 取 最 小 计算 时 间 对 应 的 结合 方式 就 是 问题 的 解 。 对 于 n 个 矩阵 ， 
不 妨 设 共有 了 T(n) 种 结合 方式 。 当 n = 1 时, T(n) = 1。 当 n> 2, 我 们 可 以 将 这 nn 个 矩 
阵 一 分 为 二 。 一 部 分 及 个 矩阵 , 另 一 部 分 就 是 n 一 个 矩阵 。 这 种 分 解 方 式 下 ,可 以 
等 于 1,2,… ,n 一 1。 因此, 可 得 


hE 愉 寺 让 
T(n) = 4! ly 
四 > THT —k), n>2 9 
b= 


上 面 这 个 递归 式 表明 , 采用 穷 举 法 的 时 间 复杂 度 是 O(2")，Q@ 也 就 是 指数 时 间 规 模 。 
下 面 我 们 考虑 使 用 动态 规划 来 得 到 一 个 多 项 式 时 间 的 算法 。 

与 一 维 动态 规划 问题 类 似 , 二 维 动态 规划 求解 问题 依然 是 五 个 基本 步骤 。 首先 , 我 
们 考虑 这 ? 个 矩阵 的 不 同 结合 方式 中 , 哪 一 个 是 最 特殊 或 者 说 特征 最 显著 的 部 分 ? 由 于 
不 管 进行 何 种 结合 ,最 后 一 定 是 形成 两 个 矩阵 相 乘 的 结果 , 因此 最 外 层 的 括号 对 是 特征 
最 显著 的 部 分 。 不 妨 设 最 外 层 括号 将 输入 矩阵 分 解 成 两 个 部 分 , 并 且 我 们 猜测 在 A[k 一 1 
和 A[A] 之 间 将 原 问题 分 解 成 两 部 分 , 也 就 是 


(A[OJA[1] -Ak — 1]) (A[k].… Aln — 1]) 




















人 @ 读者 可 以 利用 4.5.1 节 介 绍 的 替换 法 证 明 。 
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如 果 将 输入 的 矩阵 序列 看 作 字 符 串 ， 以 上 的 结果 似乎 预示 需 将 输入 矩阵 的 前 缀 和 后 
组 分 别 定义 为 两 个 子 问题 。 如 果 按 照 这 种 定义 子 问题 的 方式 ， 可 得 子 问 题 的 进一步 分 
解 为 : 
((A[O]:*: ALk’ — 1]) (A[k]:-- A — 1])) (ALk] :Aln — 1]) 


然而 ,以 上 (A[A… Alk 一) 子 问题 既 不 是 原 问 题 的 前 缀 ， 也 不 是 后 缀 。 也 就 是 
说 ， 这 种 递归 分 解 原 问题 会 产生 一 个 结构 不 一 样 的 子 问 题 ， 从 而 导致 无 法 重复 利用 求解 
原 问 题 的 策略 。 

(A[k1:… A[k 一) 既 不 是 原 问题 输入 序列 的 前 级 也 不 是 后 级 , 而 是 原 问 题 输入 序 
列 的 中 级 。 这 提示 我 们 应 该 考虑 定义 原 问 题 的 中 级 为 子 问题 , 即 A[i : 习 。 不 妨 设 DP[i, 省 
为 求解 子 问题 A[i : j] 的 策略 , 该 函数 返回 最 小 运算 次 数 。 当 i 固定 一 个 值 时 , 7 的 变化 
有 9(n), 而 i 取 值 范围 8(n)。 因 此 , 子 问题 个 数 为 8("2)。 

如 果 将 A[i : 有 ] 定义 为 子 问题 ， 设 矩阵 A[i] 到 AD] 之 间 最 后 一 个 插 弧 的 位 置 为 有。 
也 就 是 将 A[i: j] 分 成 两 部 分 , 左边 的 为 Afi : 月, 右边 部 分 为 AR 十 1 : 习 。 如 果子 问 
题 A[i : j] 的 解 为 DP[i, 有 ]， 那么 子 问 题 ALi : 有 和 Ak 十 1 :的 解 则 分 别 为 DP[i, 有 和 
DPI[k 十 1,j 有 ]。 需要 注意 , 这 三 个 子 问题 的 结构 类 似 , 都 是 输入 和 矩阵 序列 的 中 级 。 

那 DP[i, 有 ] 到 底 等 于 多 少 呢 ? 由 于 我 们 只 知道 上 取 值 范围 ?+1 到 ;一 1 之 间 , 但 并 
不 确定 大 的 取 值 。 因 此 ,这 里 不 妨 穷 举 所 有 可 能 的 大 值 , 分 别 计算 出 子 问 题 Afi : 有] 和 
AIE+1: 习 各 自 矩 阵 的 计算 时 间 。 列 举 所 有 上 大 可 能 取 值 对 应 子 问题 的 解 , 取 其 中 的 最 小 
值 就 等 于 子 问 题 DP[i,j] 的 解 。 
因此 , 可 得 子 问题 间 递归 关系 为 : 




















DP[i,j] = min {DP[i,k — 1] + DP[k,j] +cost[ 行 (Ai) x 行 (A[) x 列 (AD 站 )]} (9.10) 


其 中 , kE [i+1, 有 四 且 j 一 i > 1, 最 外 层 括 弧 对 应 的 两 个 矩阵 中 , 左边 矩阵 的 行 数 为 
A 国 的 行 、 左 边 矩 阵 的 列 数 和 右边 矩阵 的 行 数 都 是 矩阵 A[A] 的 行 数 ,右边 矩阵 的 列 数 则 
是 矩阵 A 有] 的 列 数 。 式 中 的 cost 表示 最 后 两 个 矩阵 计算 所 需 的 计算 次 数 。 

如 果 0 <j 一 i < 1, 则 意味 着 输入 矩阵 序列 只 有 两 个 , 可 直接 计算 它们 的 DP 值 , 应 
该 等 于 A[i] 的 行 数 乘 以 A[i] 的 列 数 再 乘 以 AD)] 的 列 数 。 式 (9.10) 递归 式 的 边界 条 件 为 
DP[i,j = i=0, 即 输入 矩阵 序列 个 数 只 有 一 个 时 , 其 最 优 结合 方式 就 是 该 矩阵 本 身 ， 设 
此 结合 方式 的 输出 为 0。 

以 上 递归 式 有 两 个 变量 , 分 别 为 i 和 j, 这 意味 该 动态 规划 表 是 二 维 表 。 又 因为 
j 了 之 i 因此 这 个 二 维 表 并 不 是 一 个 完整 的 矩阵 ， 而 是 矩阵 的 从 对 角 分 隔 后 的 一 半 ， 如 
图 9.15 所 示 。 

那么 按照 以 上 递归 式 填 表 过 程 是 否 符合 拓扑 排序 呢 ? 当 只 有 一 个 和 矩阵 的 时 
候 , DP[i,j = 让 =0。 也 就 是 图 9.15(a) 中 DE= 0 =0、DE=17=1、DE=27=9 引 
和 D[i = 3,7 = 3] 的 单元 格 值 为 0。 当 有 2 个 矩阵 时 ， 此 时 应 该 填写 图 9.15(a) 中 
Dfi=0,j7=]、 DEi=1,7=2 和 D[i=2,; = 3, 根据 递归 式 (9.10) 可 直接 计算 出 输出 
结果 。 当 有 3 个 矩阵 , 假设 i = 0,7 = 2, 此 时 DP[i,j] 的 计算 需要 已 知 的 单元 格 分 别 为 
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DP[E=07=0, DPl[i = 1,; = 4, DPE=07=H, DPli = 2,; = 2]。 显然 , 这 些 单 元 
格 的 值 已 经 在 计算 DP[i = 0,7 = 2] 之 前 得 到 。 因此, 按 递归 式 (9.10) 填 表 的 过 程 符合 拓 
扑 排 序 。 


0 1 2 3 








(a) 
图 9.15 矩阵 结合 问题 的 状态 图 


式 (9.10) 的 求解 过 程 符合 拓扑 排序 , 因此 可 利用 自 底 向 上 的 方法 实现 递归 式 , 见 代 
码 9.14。 该 代码 的 功能 就 是 填写 二 维 表格 DP[i, j]， 如 图 9.15(a) 所 示 。 填 表 的 过 程 就 是 
从 图 的 浅 色 部 分 逐渐 向 深 色 部 分 进行 , 初始 条 件 时 只 有 一 个 和 矩阵, 第 一 次 循环 填写 的 是 
两 个 矩阵 情况 下 的 最 优 结 合 , 第 二 次 循环 填写 的 则 是 三 = 个 知 阵 情况 下 的 最 优 结合 合 , 依 此 
类 推 。 DP[0,n 一 1] 的 值 即 为 原始 问题 的 解 , 也 就 是 图 9.15 中 左上 角 单 元 格 的 值 。 

代码 9.14 的 第 1 行 变量 gk 是 通过 一 个 lambda 表达 式 将 索引 i 和 组 合成 一 
对 串 ， 从 而 便于 后 面 在 字典 类 型 变量 m 中 当 作 key。lambda 表达 式 在 Python 语言 
中 是 较为 常用 的 一 种 简单 函数 实现 方式 。 对 lambda 感 兴趣 的 读者 可 以 参考 官方 文档 
https://docs.python.org/3/tutorial/controlflow.html。 

根据 子 问题 个 数 O(n2), 以 及 每 一 个 子 问 题 求 解 的 时 间 复 杂 度 O(n), 可 得 利用 动态 
规划 求解 该 问题 算法 复杂 度 为 O(n3)。 如 果 还 需要 返回 具体 的 结合 方式 ， 可 以 通过 记录 
单元 格 的 父 结 点 来 获得 , 读者 可 以 修改 代码 9.14 来 完成 这 一 功能 。 


代码 9.14 ”矩阵 括号 问题 的 动态 规划 实现 





1 gk = lambda i,j:str(i)+','+str(j) 
2 def memoized matrix_chain(p): 


3 n = len(p)-1 

nf{} 

for i in range(1, n+1): 

6 for j in range (i, n+1): 

7 m[gk(i，j)] = float("inf") # 初始 化 矩阵 严 
8 return lookup_chain(m, p, 1, n) 


10 def lookup_chain(m, p, i, j): 
11 if m[gk(i, j)] < float("inf"): 
12 return m[gk(i, j)] 
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if i = j: 
m[gk(i，j)] = 0 # 矩阵 对 角 置 为 0 
else: 


for k in range(i, j): 
q = lookup_chain(m, p, i, k) + lookup_chain(m, p, k+1, j) + 
一 pl[li-1]*p[k]*p[j] 
if q < m[gk(i, j)]: 
m[gk(i, j)] = q 
return m[gk(i, j)] 





以 输入 矩阵 序列 [Ao,， A1, A2, Aa]、 和 矩阵 大 小 [20 x 25,25 x 15,15 x 5,5 x 12] 为 
例 。 按照 代码 9.14 填写 的 动态 规划 表 结 果 如 图 9.15(b) 所 示 。 当 ii= 0,7 = 2 时 ,大 分 
别 等 于 1 和 2。 如 果 大 = 1， 则 意味 着 结合 方式 为 Ao(Al x A2),， 此 时 的 DP 值 等 于 
0+1875 十 20x25x5=4375。 而 当 上 = 2 时 , 则 意味 着 结合 方式 为 (AoxA1)A2, 此 时 的 DP 
值 等 于 2500+0+20x15x5=9000。DP[ = 0,7 = 2] 的 值 应 该 等 于 以 上 DP 值 中 相对 小 
的 4375。 在 求 得 DP[0, 3] 的 值 以 后 ,可 以 通过 结 点 之 间 的 连接 关系 得 到 矩阵 的 最 佳 结合 
方式 为 (Ao(A1xA2))xAs。 


9.4.2 ”字符 串 编辑 距离 


近年 来 , 我 国 将 检测 短 串联 重复 (STR，Short Tandem Repeat) 技 术 应 用 到 犯罪 侦 
探 中 。STR 是 人 体 中 染色 体 的 一 段 , 它 以 2 个 至 5 个 碱 基 为 核心 进行 重复 , 每 个 人 的 重 
复 次 数 不 同 , 并 且 具 有 遗传 性 。 只 要 检测 多 个 STR 位 点 , 就 可 以 做 个 体 的 认定 , 进而 使 
DNA (脱氧 核糖 核酸 , Deoxyribonucleic Acid) 检测 得 以 应 用 于 实际 工作 中 。 从 案件 现场 
提取 到 的 一 滴 血 、 一 根 毛发 甚至 皮 眉 中 就 能 找到 指认 犯罪 的 铁证 , 所 以 DNA 也 被 人 们 
称 为 “血液 指纹 ”。 

在 第 3.2 节 , 我 们 曾经 完成 了 一 个 拼写 纠正 程序 ， 即 找到 与 输入 字符 串 最 相近 的 
一 个 正确 的 单词 。 不 管 是 DNA 比较 还 是 单词 拼写 纠正 问题 ， 都 可 以 形式 化 的 表述 
为 : 给 定 两 个 字符 串 zx 和 wy， 如 果 要 将 字符 串 z 转换 为 y, 转换 过 程 只 有 三 个 基本 操 
作 (插入 (ins) 字符 C, 删除 (del) 字符 C, 将 字符 C 替换 (rep) 为 字符 C'), 那么 如 
何 组 合 这 些 操作 从 而 使 得 转换 的 代价 最 小 , 这 就 是 字符 串 编辑 距离 优化 问题 的 形式 化 
描述 。 

操作 的 基本 代价 需要 根据 具体 的 问题 进行 定义 。 如 在 比较 某 个 DNA 序列 与 另外 
的 两 个 序列 的 相似 性 时 , 根据 基因 突变 的 理论 知 , 碱 基 C 到 碱 基 G 的 变换 就 比 碱 基 
C 到 碱 基 A 的 变换 代价 小 。 假 设 插入 与 删除 操作 的 代价 均 为 1， 而 替换 操作 的 代价 为 
无 穷 大 , 那么 最 小 编辑 距离 等 价 于 寻找 两 序列 的 最 长 公共 子 序列 (Longest Common 
Subsequence, LCS) 。 比 如 单词 HIEROGLYPHOLOGY 与 MICHAELANGELO, 它们 
最 长 公共 子 序列 就 是 另外 一 个 英文 单词 HELLO。 

字符 串 编辑 距离 是 一 个 优化 问题 , 我 们 考虑 采用 动态 规划 来 求解 。 首先, 依然 是 需 
要 确定 子 问 题 .该 问题 与 本 章 之 前 的 问题 不 同 , 之 前 问题 的 输入 都 是 一 个 序列 ,而 字符 
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串 编辑 距离 问题 的 输入 是 两 个 序列 。 那 么 该 如 何 定义 子 问题 呢 ? 这 里 我 们 考虑 将 输入 序 
列 的 后 缀 作为 子 问题 ,也 就 是 分 别 取 输入 字符 串 zx 和 vy 的 后 面部 分 作为 子 问题 。 
不 妨 设 函数 DP 是 用 于 求解 该 问题 的 策略 , 那么 将 DP(z[i :],y[D :]) 定义 为 子 问题 ， 
其 中 0 < i < len(z), 0 < 7 < len(y), len( ) 为 求 长 度 的 函数 。 需要 注意 的 是 , 这 时 函数 
DP 的 输入 是 两 个 变量 。 因为 当 z 固定 i, j 可 取 值 的 范围 是 0 到 Len(y), 而 i 的 取 值 范 
围 则 是 0 到 len(z) 之 间 。 因此, 子 问 题 的 个 数 为 O(len(z)len(y))。 
在 定义 了 子 问 题 后 , 就 需要 建立 子 问题 解 的 递归 关系 。 如 图 9.16(a) 所 示 , 为 了 将 字 
符 串 rz 转换 为 y, 对 于 字符 zfi] 无 非 经 历 以 下 三 种 情况 的 操作 : 
。 删除 字符 z 国 ,如 图 9.16(b) 所 示 。 此 时 DP(z[i :],y[7 :])=DP(z[i 十 1:],vy[7 :]) 十 
cost(delz[i]); 
。 插 入 字符 y[ 胃 ， 如 图 9.16(c) 所 示 。 此 时 DP(z[i :],y[i :])=DP(z[i :],y[i 十 1 :]) 二 
cost(ins, []); 
。 替换 字符 zfi] 为 y[ 四 ， 如 图 9.16(d) 所 示 。 此 时 DP(z[i :],y[ :])=DP(zli 二 1;]， 
[7 十 1 :])+cost(repy[)。 
其 中 , cost( ) 函数 为 执行 一 次 操作 的 代价 ,del、ins 和 rep 分 别 表 示 删 除 、 插 入 和 替 
换 操 作 。 
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图 9.16 子 问题 的 结构 


根据 以 上 分 析 不 难 建立 各 个 子 问题 之 间 的 递归 关系 , 为 : 


DP(z[E 二 1:],y[ :]) + cost(del;[il), i < len(z) 
DP(z[i:], yi :]) = min y DP(z[i :], yl; + 1 :]) + cost(insy{)]), 了 < len(y) 


DP(z[i+1:],yli+1:])+cost(rep,[)]), i < len(z),7 < len(y) 
(9.11) 











其 中 , 递归 式 的 初始 条 件 为 DP(len(z), len(y)) = 0。 
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有 了 以 上 递归 式 后 , 求解 原 问 题 的 解 相当 于 填写 如 图 9.17 所 示 的 二 维 表 。 该 表 的 
填写 过 程 是 从 右 下 到 左上 , 对 于 单元 格 (i,j), 它 的 值 只 与 (i,j 十 1)、(i 十 1,7 十 1) 和 





(i 十 1,7) 这 三 个 单元 格 有 关 , 而 这 三 个 单元 格 值 的 计算 总 是 先 于 单元 格 (i,j)。 因 此 ， 


照 以 上 递归 式 填写 动态 规划 表 的 过 程 相当 于 在 表 上 做 拓 扑 排 序 。 





图 9.17 字符 串 编 辑 距 离 问 题 状态 图 


(nm-l1) | (nm) 





代码 9.15 字符 申 编辑 距离 的 动态 规划 实现 


def min edit_dist(target, source): 
n = len(target) 
m= len(source) 
# 初始 化 二 维 动态 规划 表 
distance = [[0 for i in range(m+1)] for j in range(n+1)] 
# 边界 条 件 
for i in range(n): 
distance[i] [m-1] = distance[i+1] [m] + insertCost(target[i]) 
for j in range(m): 
distance[n-1] [j] = distance[n] [j+1] + deleteCost(source[j]) 
distance[n-1] [m-1] = substCost(source[m-1] ,target [n-1]) 
# 自 底 向 上 求解 递归 式 
for i in range(n-2,-1, -1): 
for j in range(m-2,-1, -1): 
distance[i] [j] = min(distance[i+1] [j]+1, 
distance[i] [j+1]+1, 
distance[i+1] [j+1]+substCost (source[j] ,target [i])) 


return distance 


按 





按照 式 (9.11) 求解 字符 编辑 问题 的 实现 见 代码 9.15， 其 中 ,函数 insertCost()、 
deleteCost( ) 和 函数 substCost( ) 分 别 为 插入 、 删 除 和 替换 的 价值 函数 , 这 三 个 函数 的 
实现 见 代 码 9.16。 最 终 问题 的 解 即 为 动态 规划 表 DP(0, 0) 的 值 , 如 果 需 要 求 得 具体 操作 


指令 , 同样 可 以 通过 记录 单元 格 父 结 点 来 实现 。 
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代码 9.16 价值 函数 





def insertCost(i) : 


return 1 


def deleteCost(i) : 
return 1 


def substCost(i, j): 
if ie=j: 
return 0 
else: 
return 1 


如 果 输 入 的 字符 串 分 别 为 "geek" 与 "gesek"， 那么 按照 代码 9.15 得 到 的 最 小 编辑 距 
离 为 1, 即 只 需要 删除 gesek 中 的 字母 s 即 可 。 按 代码 9.15 得 到 的 二 维 动态 规划 表 为 : 


[ 员 名 名 名 届 宙 
区 二 二 二 而 
[2, 1, 1, 0, 1, 0]， 
[ 册 放 负 坟 克 0] 
[0, 0, 0, 0, 0, 0]] 


当 输 入 的 字符 串 分 别 为 "sunday" 和 "saturday", 那么 按照 代码 9.15 得 到 的 最 小 编辑 
距离 为 3。 这 两 个 字符 串 第 1 个 和 最 后 3 个 字符 相同 , 将 sunday 中 的 un 的 前 面 插入 at 
再 将 mn 替换 为 T 后 可 得 到 atur, 也 就 是 经 过 3 次 编辑 就 可 以 将 sunday 变换 为 saturday。 
由 于 子 问题 的 个 数 为 O(len(z)len(y)), 每 一 个 子 问题 求解 的 时 间 复 杂 度 为 O(1), 因 
此 代码 9.15 的 时 间 复 杂 度 为 O(len(z)len(y))。 

















9.4.3 ”0-1 背包 问题 


为 了 吸引 观众 , 各 卫视 开播 了 许多 真人 游戏 节目 。 一 类 韶关 游戏 节目 很 受 观众 欢迎 ， 
因为 参与 节目 的 观众 可 以 获得 价值 不 菲 的 奖品 。 在 游戏 中 , 参与 的 观众 需 回 答 一 系列 问 
题 , 答对 的 观众 将 有 机 会 在 规定 的 时 间 内 挑选 奖品 。 由 于 有 时 间 限 制 , 因此 大 部 分 观众 
会 选择 这 些 奖 品 里 面 价值 最 高 的 物品 搬 走 。 但 是 ,电视 台 挑 选 的 备 选 奖品 非常 有 意思 ， 
其 中 价值 高 的 往往 体积 大 , 不 容易 搬 动 , 比如 大 彩电 或 者 大 电 冰 箱 。 因 此 , 观众 为 了 获取 
最 大 的 收益 ， 需 要 权衡 是 拿 价值 小 的 物品 〈 如 一 壶 油 、 一 箱 饼干 ), 通过 多 拿 几 趟 获得 最 
大 收益 ; 还 是 尽量 拿 价值 大 的 物品 , 但 这 样 减少 了 拿 的 趟 数 ， 甚 至 规定 时 间 内 都 难以 完 
成 一 趟 。 

0-1 背包 问题 与 以 上 游戏 非常 类 似 , 都 是 需要 从 一 堆 物 品 中 进行 挑选 , 或 者 说 决 
策 (物品 i 是 拿 走 还 是 不 拿 ), 从 而 确保 总 收益 最 大 。0-1 背包 问题 有 一 个 限制 条 件 是 , 挑 
选 的 物品 只 能 装 进 一 个 背包 里 面 。 由 于 背包 容量 有 限 , 因此 同样 需要 权衡 。 如 果 都 挑选 
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价值 大 的 物品 装 包 ,有 可 能 装 不 了 几 个 物品 。 也 就 是 说 需要 在 物品 的 价值 和 包容 量 之 间 
进行 权衡 。 

我 们 可 以 把 以 上 问题 进行 形式 化 定义 。 假设 有 n 个 物品 , 每 个 物品 i 的 价值 为 w， 
大 小 为 si。 包 的 容量 为 5, 要 求 从 这 n 个 物品 中 挑选 若干 物品 装 进 包 中 , 在 所 有 装 进 包 
中 物品 的 大 小 小 于 等 于 包容 量 5 的 前 提 下 , 包 中 物品 总 价值 最 大 。 比 如 ， 有 3 个 物品 ， 
它们 的 大 小 和 价值 分 别 为 : 








(s0= 3,v0=4);(s1=4,v1 =5);(s2 = 5,v2 = 6) 





其 中 , 包 的 容量 8 = 10。 那么 ,应 该 选择 物品 (s1 = 4,v1 = 5); (s2 = 5,v2 = 6)。 此 
时 , si 十 s2 二 9< 5 ==10, 且 这 种 选择 的 情况 下 总 价值 vi 十 v2 = 11 最 大 。 

为 了 使 用 动态 规划 求解 该 问题 。 各 个 物品 构成 了 输入 序列 , 对 于 第 i 个 物品 , 无 非 
有 两 个 状态 : 放 入 包 中 或 者 不 放 入 包 中 。 除 此 外 ， 当 前 状态 还 需要 考虑 当 物 品 放 入 或 者 
不 放 入 后 , 包 的 容量 发 生 的 变化 。 由 此 , 可 以 定义 子 问题 从 物品 0,… ,i 一 1,i 中 选取 若 
干 物品 置 于 包 中 , 这 些 物品 的 重量 为 X,， 且 获取 了 最 佳 收益 。 假 设 该 子 问题 可 以 经 由 策 
略 Knapsack 来 求解 ,该 策略 此 时 的 输入 参数 为 Knapsack(i, 和 X)。 


站 








图 9.18 背包 问题 的 子 问题 


这 样 不 难得 到 0-1 背包 问题 的 子 问题 个 数 为 0(m5), 这 是 因为 函数 Knapsack(z, 愉 ) 
中 i 的 取 值 为 0,1,… ,n 一 1, 而 的 范围 是 [0, 3]。 那 么 各 个 子 问题 之 间 的 递归 关系 是 
什么 ? 如 图 9.18 所 示 , 需要 考虑 第 i 个 物品 的 两 种 可 能 的 情况 : 

。 物品 i 不 放 入 包 中 。 那么 Knapsack(i;,X) 的 解 等 于 从 物品 0,… ,i 一 1 选取 容量 
为 的 物品 价值 ,也 就 是 Knapsack(i, 天 )=Knapsack( 一 1,X); 

。 物品 i 放 入 包 中 。 那 么 Knapsack(i, 关 ) 的 解 应 该 等 于 剩余 物品 0,… ,i 一 1 放 入 
容量 为 和 一 si 的 包 中 物品 价值 再 加 上 物品 i 的 价值 w, 也 就 是 Knapsack(i, 六)= 
Knapsack(i — 1, X 一 si) 十 vis 

由 于 背包 问题 要 求 获得 最 佳 收益 ， 因 此 以 上 两 种 情况 下 取 较 大 的 值 作为 

Knapsack(i 一 1, 义 ) 的 解 。 
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1 
过 
A 
4 
5 
6 
这 
8 
9 


根据 以 上 分 析 可 得 以 下 递归 式 : 


Knapsack(i— 1, X) 
Knapsack(i 一 1, 关 一 si) 十 vi， 如 果 久 > si 


Knapsack(i, X) = max | (9.12) 

不 难看 出 , 填写 图 9.19 所 示 的 表格 可 以 采用 由 自 底 向 上 方法 实现 ， 因 为 填 表 满足 
拓扑 排序 的 过 程 。 如 填写 图 9.19 中 单元 格 (i,7) 的 值 , 需要 已 经 求 得 该 单元 格 上 一 行 从 
(i 一 1,0) 到 (i 一 1,7) 之 间 各 个 单元 格 的 值 , 由 于 这 些 单元 格 的 值 已 知 ， 因 此 计算 单元 格 
人 了) 的 值 满足 拓扑 排序 。 这 意味 着 递归 式 (9.12) 可 采用 自 底 向 上 的 方式 进行 求解 。 


0 9 





(0,0) (0,D) (0,5-1) | (0,5) 





(1,0) (1,1) (1,5-1) | (1,5) 


图 9.19 背包 问题 状态 示意 图 


代码 9.17 相当 于 填写 如 图 9.19 的 表 , 表格 的 横 坐 标 [0,1,2,… ,3 一 1, 3] 表示 剩余 
容量 的 变化 , 纵 坐 标 [0, 1,… ,n] 为 物品 的 索引 , 每 一 个 单元 格 表示 一 个 状态 ,。 当 i=0 
时 , 由 于 没有 物品 可 以 放 入 包 中 , 因此 得 边界 条 件 为 Knapsack(0, 头 )=0, 其 中 , 0< XX < 
5。 原始 问题 的 解 为 Knapsack(n, 5S), 即 图 9.19 中 的 右 下 角 单 元 格 。 


代码 9.17 背包 问题 的 动态 规划 实现 


def knapSack(W, wt, val, n): 
K = [[0 for x in range(W+1)] for x in range(n+1)] 


for i in range(n+1): 
for W in range(W+1): 
if i==0 or Ww==0: 
K[i][w] = 0 
elif wt[i-1] <= w: 
K[i] [w] = max(val[i-1] + K[i-1] [w-wt[i-1]], K[i-1][w]) 
else: 


K[i] [w] = K[i-1] [w] 


return K 
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以 5=10, 3 个 物品 的 大 小 [3, 4, 5] 和 价值 [4, 5, 6] 为 例 , 按照 代码 9.17 执行 后 的 二 
维 动态 规划 表 为 : 


[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]， 

[0, 0, 0, 4, 4, 4, 4, 4, 4, 4, 9, 

[0, 0, 0, 4, 5, 5, 5, 9, 9, 9, 9], 
[0, 0, 0, 4, 5, 6, 6, 9, 10, 11, 11]] 


结果 意味 着 包 最 多 可 以 放 入 物品 的 总 价值 为 11。 如 果 算法 不 仅 需 要 返回 包 中 能 放 物 
品 的 价值 和 , 还 需要 列 出 哪些 物品 被 添加 ,那么 只 需要 在 填写 表格 时 ,添加 每 一 个 单元 
格 求 值 是 根据 哪 一 个 单元 格 得 到 的 这 一 信息 即 可 。 这 样 就 可 以 从 单元 格 (n,5) 开始 根据 
父 结 点 进行 回溯 即 可 , 读者 可 以 根据 代码 9.17 完成 该 功能 。 以 上 问题 的 第 2 个 物品 和 第 
3 个 物品 应 该 放 入 包 内 。 

利用 动态 规划 求解 0-1 背包 问题 需要 求解 0(m5) 个 子 问 题 , 每 一 个 子 问题 依赖 于 另 
外 两 个 子 问题 之 一 的 值 ， 由 于 采用 自 底 向 上 实现 递归 , 每 一 个 子 问题 所 需 时 间 复 杂 度 为 
O(1), 因此 总 的 时 间 复 杂 度 为 O(n.5)。 但 是 需要 特别 指出 的 是 , 其 算法 时 间 复 杂 度 并 非 
多 项 式 时 间 , 而 是 伪 多 项 式 时 间 。 

使 用 动态 规划 求解 0-1 背包 问题 的 时 间 复 杂 度 为 O(m5), 该 时 间 复 杂 度 不 仅 是 输入 
规模 n 的 函数 ,也 与 背包 容量 5S 这 一 数值 有 关 。 在 2.2 节 我 们 已 经 知道 RAM 机 器 模 
型 对 于 数值 S 的 存储 需要 b= log 5 个 比特 位 , 那么 0-1 背包 问题 的 时 间 复 杂 度 可 写 为 
O(n24)。 当 存储 物品 大 小 的 比特 位 翻 倍 5 = 26, 那么 算法 的 时 间 复 杂 度 将 呈 指 数 规模 
增长 。 

需要 注意 的 是 ， 当 物品 个 数 增加 1 倍 w = 2n, 算法 的 时 间 复 杂 度 呈 线 性 时 间 增 长 。 
也 许 读者 会 有 疑惑 ， 为 什么 输入 规模 的 分 析 与 容量 3 不 一 样 ? 这 是 因为 n 个 输入 数据 
的 每 一 个 数据 一 般 都 可 以 在 RAM 中 的 一 个 字 节 内 存储 ， 当 输入 规模 ? 增加 时 , 字 节 的 
个 数 按照 相同 的 增长 规模 增长 。 然 而, 如 果 算 法 复杂 度 与 输入 的 数值 数据 有 关 ， 这 时 存 
储 数值 数据 的 比特 位 可 能 超过 一 个 字 节 具 有 的 比特 位 数 ， 存储 数值 数据 的 比特 位 的 增长 
就 会 导致 算法 复杂 度 按照 指数 规模 增长 。 
因此 , 我 们 说 动态 规划 求解 0-1 背包 问题 的 时 间 复 杂 度 是 伪 多 项 式 时 间 , 因为 随 着 
输入 规模 的 翻 倍 ， 其 时 间 复 杂 度 并 不 总 是 呈 线 性 时 间 增 长 , 而 是 有 可 能 呈 指 数 规模 增长 。 
然而 , 伪 多 项 式 时 间 与 指数 增长 并 不 相同 , 算法 复杂 度 如 果 是 指数 规模 增长 表明 这 个 算 
法 效率 在 输入 规模 较 大 的 情况 下 没有 实用 价值 , 然而 伪 多 项 式 时 间 复 杂 度 算法 在 输入 规 
模 较 大 的 情况 下 依然 是 一 个 可 以 接受 的 算法 。 








9.5 小结 


动态 规划 是 一 类 用 于 解决 优化 问题 的 方法 。 使 用 动态 规划 解决 问题 的 难点 在 于 , 它 
并 没有 一 个 固定 的 公式 。 由 于 各 种 问题 的 性 质 不 同 , 确定 最 优 解 的 条 件 也 互 不 相同 , 因 
而 动态 规划 的 设计 方法 对 不 同 的 问题 , 有 各 具 特 色 的 解 题 方法 , 并 不 存在 一 种 万 能 的 动 




















180 算法 设计 与 分 析 (Python) 





态 规 划算 法 用 于 解决 各 类 最 优化 问题 。 但 是 , 我 们 依然 可 以 总 结 出 一 些 共性 的 步骤 。 

本 章 将 动态 规划 归纳 为 “递归 ”“ 记 忆 ” 和 “猜测 ”。 动 态 规划 的 核心 是 构建 子 问题 间 
的 “递归 ”关系 。 而 为 了 要 建立 这 一 关系 , 不 妨 大 胆 地 采用 “猜测 ” 去 得 到 子 问题 间 的 递 
归 关 系 。 在 猜测 的 时 候 需 要 注意 的 是 , 猜测 的 结果 并 不 准确 , 还 需要 将 各 种 可 能 的 结果 
考虑 进去 。 因此， 从 这 个 角度 而 言 , 动态 规划 可 以 看 作 是 一 类 “限定 范围 ”的 穷 举 。 

建立 子 问题 间 的 递归 关系 后 , 下 一 步 就 是 实现 该 递归 关系 。 本 章 介绍 采用 “记忆 ”的 
方法 来 实现 递归 ,以便 提 高 递归 的 执行 效率 。 之 所 以 可 以 通过 记忆 来 提高 递归 的 执行 效 
率 , 是 因为 存在 诸多 重复 的 子 问题 。 对 于 已 经 计算 出 结果 的 子 问题 ,应 该 先 将 结果 存 表 。 
在 下 次 需要 计算 某 个 子 问题 时 , 就 可 以 通过 查 表 , 而 非 递归 调用 函数 来 实现 。 因 此 ,动态 
规划 通过 “记忆 ”这 一 技术 能 提高 实现 的 效率 。 

动态 规划 算法 的 执行 时 间 等 于 子 问题 数 乘 以 每 个 子 问题 的 执行 时 间 。 在 设计 子 问题 
时 ， 通 过 本 章 的 例子 不 难 发 现 , 往往 考虑 将 输入 序列 的 前 级 、 后 绥 或 者 中 级 当成 一 个 子 
问题 。 究竟 选择 哪个 部 分 作为 子 问 题 , 最 为 关键 的 是 子 问题 结构 要 类 似 。 比 如 , 一 个 问题 
A 是 将 输入 的 前 级 A[] 作为 子 问题 , 那么 该 子 问题 A[] 的 子 问题 A[j] 应 该 还 是 A[] 
的 前 级 , 这 样 就 保证 了 子 问题 结构 的 一 致 性 。 





课 后 习题 


习题 9-1 ”最 长 递增 子 序列 
输入 序列 A=[18, 17, 19, 6, 11, 21, 23, 15]。 请 给 出 序列 求解 A 中 最 长 递增 子 序列 
的 动态 规划 算法 , 并 分 析 算 法 时 间 复 杂 度 。 


习题 9-2 ”矩阵 乘法 的 结合 


输入 矩阵 五 , 忆 , 忆 , 已 , 它们 各 自行 与 列 数 分 别 为 40 x 20, 20 x 30, 30 x 10, 10 x 30， 
请 根据 代码 9.14 画 出 二 维 动态 规划 表 结 果 。 
习题 9-3 ”整数 划分 问题 

对 于 从 1 到 六 的 连续 整 集合 合 ,能 划分 成 两 个 子 集合 , 且 保 证 每 个 集合 的 数字 和 是 
相等 的 。 比 如 N=3, 对 于 [1,， 2, 3] 能 划分 成 两 个 子 集合 , 它们 每 个 的 所 有 数字 和 是 相等 
的 : [1, 2] 和 [3]。 这 是 唯一 一 种 分 法 (交换 集合 位 置 被 认为 是 同一 种 划分 方案 , 因此 不 会 
增加 划分 方案 总 数 ) 。 

设计 一 个 算法 ， 当 给 出 整数 NN, 算法 应 该 输出 划分 方案 总 数 ， 如 果 不 存在 这 样 的 划 
分 方案 , 则 输出 0。 


习题 9-4 ”最 长 公共 子 序列 


如 果 字 符 串 1 的 所 有 字符 按 其 在 字符 串 中 的 顺序 出 现在 另外 一 个 字符 串 2 中 , 则 字 
符 串 1 称 之 为 字符 串 2 的 子 串 。 注意 , 并 不 要 求 子 串 (字符 串 1) 的 字符 必须 连续 出 现在 
字符 串 2 中 。 
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请 编写 一 个 函数 , 输入 两 个 字符 串 , 求 它们 的 最 长 公共 子 串 , 并 打印 出 最 长 公共 子 
串 。 例 如 : 输入 两 个 字符 串 BDCABA 和 ABCBDAB, 字符 串 BCBA 和 BDAB 都 是 它 
们 的 最 长 公共 子 串 , 则 输出 它们 的 长 度 4, 并 打印 任意 一 个 子 串 。 
习题 9-5 ”双人 游戏 问题 

有 如 下 一 个 双人 游戏 :N(2 < N < 100) 个 正 整数 的 序列 放 在 一 个 游戏 平台 上 , 两 人 
轮流 从 序列 的 两 端 取 数 ， 取 数 后 该 数字 被 去 掉 并 累加 到 本 玩家 的 得 分 中 ， 当 数 取 尽 时 ， 
游戏 结束 。 以 最 终 得 分 多 者 为 胜 。 

编 一 个 执行 最 优 策 略 的 程序 ,最 优 策 略 就 是 使 自己 能 在 当前 情况 下 得 到 最 多 总 分 的 
策略 。 要 求 程序 要 始终 为 第 二 位 玩家 执行 最 优 策略 。 
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本 章 学 习 目 标 
。 掌握 最 大 流 问 题 的 定义 ， 了 解 流量 、 容 量 以 及 它们 之 间 的 关系 
。 掌握 增 广 路 径 求 最 大 流 问 题 的 过 程 
e 了 解 Ford-Fulkerson 和 Edmond-Karp 算法 以 及 它们 之 间 的 差异 
e 了 解 将 计算 问题 转化 为 最 大 流 问 题 的 基本 过 程 


10.1 引言 


不 管 是 人 与 人 之 间 构 成 的 复杂 人 际 关系 网 , 还 是 生物 与 生物 之 间 构 成 的 复杂 的 食物 

链 网 络 , 通过 网 络 都 可 以 在 网 络 结 点 间 传 递 信 息 。 给 定 网 络 结构 ,一 个 常见 的 问题 就 是 
如 何 实现 网 络 中 信息 的 快速 传递 , 以 及 计算 网 络 中 信息 的 流量 。 

比如 ，2008 年 10 月 28 日 新 闻 报 道中 国 和 俄罗斯 当天 签署 了 一 项 协议 , 即 在 西伯 利 
亚 铺设 一 条 通 往 中 国 的 石油 管线 , 该 管线 预计 每 年 可 向 中 国 输送 1500 万 吨 石油 。 该 管道 
途经 国内 的 许多 城市 , 并 与 国内 已 有 的 石油 管线 对 接 。 假设 该 管线 由 西伯 利 亚 可 达 我 国 
的 上 海 市 , 每 一 段 管 线 由 当地 政府 施工 ， 其 管线 的 直径 将 根据 当地 的 经 济 状况 确定 。 因 
此 ， 如 果 将 每 个 城市 看 作 结 点 ,那么 城市 间 的 管道 就 是 边 , 边 标注 的 是 该 段 管道 的 直径 。 
最 大 流 问题 就 是 , 求 出 从 西伯 利 亚 出 发 到 上 海 的 这 个 石油 管 网 中 能 够 允许 的 最 大 流量 。 

网 络 流 的 应 用 已 遍及 通信 、 运 输 、 电 力 、 工 程 规划 、 任 务 分 派 、 设 备 更 新 以 及 计算 机 
辅助 设计 等 众多 领域 。 本 章 首先 通过 图 来 形式 化 最 大 流 问 题 ， 并 给 出 一 个 直观 的 求解 算 
法 。 在 此 基础 上 , 进一步 介绍 两 个 最 大 流 算法 , 即 Ford-Fulkerson 算法 和 Edmond-Karp 
算法 。 最 后 , 通过 二 向 图 最 大 匹配 问题 和 文件 传输 问题 ， 向 读者 展示 最 大 流 算法 如 何 用 
于 求解 其 他 的 计算 问题 。 





10.2 ”最 大 流 算 法 


我 们 通过 图 来 形式 化 描述 以 上 石油 管 网 的 最 大 流 问 题 。 给 定 有 向 图 G=(V, PE), 图 
中 的 每 一 个 结 点 代表 一 个 城市 , 其 中 结 点 seV 表示 源 点 (西伯利亚), 结 点 teV 表示 
目标 点 (上海)。 如 果 城 市 u 和 间 有 管道 连接 , 则 存在 一 条 连接 u 和 v 间 的 边 , 即 (u， 
V)EE。 这 条 边 是 有 方向 的 ， 且 边 还 有 一 个 属性 用 于 描述 管道 的 直径 , 我 们 称 这 个 属性 为 
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容量 c(u, v)。 显然 , 容量 是 一 个 非 负 的 值 ， 如 果 结 点 u 和 结 点 v 之 间 不 存在 边 的 连接 ， 
那么 设 其 容量 为 0, 也 就 是 c(u, Vv)=0, (u, Vv)#4 E。 边 上 除了 容量 外 ,还 有 一 个 属性 表示 
管道 当前 石油 的 流量 , 其 表示 为 f(u, v), (u, v)e 卫 。 

如 图 10.1 所 示 , 结 点 与 v 连接 , 其 中 c(u, v)=3 表示 该 段 管 道 最 多 容许 3 个 单位 
的 石油 流 过 ，f(u, v)=2 则 表示 当前 流 经 该 管道 的 石油 流量 为 2 个 单位 。 

















2:3 
> 
流量 f= 1 容量 c = 3 


图 10.1 容量 与 流量 示意 图 


流量 就 是 结 点 与 结 点 到 一 个 实数 的 映射 , 即 f:Vx V 一 R, 且 图 上 的 流量 应 该 满足 
以 下 限制 ; 

(1) 容量 限制 。 流 经 某 段 管道 的 流量 不 能 超过 该 段 管道 的 容量 , 也 就 是 f(u, v)< c(u， 
V), u, VE V。 需要 注意 的 是 , 这 里 并 不 限制 u 和 v 之 间 一 定 是 一 条 边 。 

(2) 流量 保存 。 对 图 中 除了 源 点 和 目的 点 之 外 的 其 他 结 点 ue V 一 {s, t}, 流入 的 石油 
单位 应 该 等 于 流出 的 石油 单位 , 也 就 是 忽略 石油 在 管道 中 可 能 的 各 种 损耗 。 用 数学 形式 
表示 这 一 限制 就 是 沁 ,ev fu v)=0, 图 10.1 中 结 点 u 流入 的 石油 单位 为 1+2=3, 流出 
的 石油 同样 等 于 3 个 单位 。 

(3) 偏 对 称 性 。 上 一 限制 条 件 成 立 需 要 我 们 定义 一 个 对 称 性 的 量 , 即 如果 u 和 是 
图 中 结 点 , 则 f(u, Vv)= 一 了 (v, u)。 如 图 10.1 所 示 的 结 点 4u 和 v, f(u, Vv)=2, f(v, u)= 一 2。 

给 定 G=(V, E) 上 的 流量 f， 由 于 流量 一 定 大 于 0, 因此 表示 为 |f|, 其 值 为 : 


HI=> fs,v) = f(s,V) (10.1) 
veV 
也 就 是 说 , 我 们 用 f(s, V) 来 表示 图 G 中 ,从 源 点 s 出 发 到 各 个 结 点 的 流量 。 需 要 


强调 的 是 f(s, V) 也 要 满足 前 面 的 三 个 限制 条 件 。 
有 了 这 个 定义 后 , 我 们 可 以 很 方便 地 表示 图 中 一 些 简单 的 结论 。 比 如 ， 从 源 点 s 流 
出 的 流量 和 等 于 流入 目标 点 t 流量 和 ， 即 
f(s,V) = HCV (102) 


比如 图 10.1 中 , f(s, V)=f(V, t)=3。 
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最 大 流 问 题 中 一 个 非常 有 意思 的 结果 是 流量 与 图 割 的 关系 。 割 就 是 把 图 结 点 分 开 的 
边 , 见 图 10.2 中 的 虚线 , 该 虚线 的 一 部 分 包括 两 个 结 点 集合 S,， 另 一 个 部 分 就 是 剩 下 的 
4 个 结 点 集合 T。 其 中 , 集合 S 包括 了 源 点 s, 而 了 则 包含 目标 点 t。 通过 这 个 割 的 流量 
为 f(S, T)=(2 十 2) 十 (-2 十 1 一 1 十 2)=4, 也 就 是 说 f(S, T)=f(s, V)=|f|， 即 通过 制 上 
的 流量 等 于 图 上 从 源 点 s 出 发 到 各 个 结 点 的 流量 。 需要 注意 的 是 , 这 个 结果 需要 满足 的 
条 件 就 是 源 点 和 目标 点 在 不 同 的 集合 。 








图 10.2 通过 制 的 流量 


割 上 除了 定义 流量 外 , 还 定义 了 容量 。 图 10.2 中 所 示 的 制 的 容量 为 c(S, T)=3 二 2+ 
1+3=9。 与 制 上 的 流量 需要 区 别 的 就 是 , 容量 只 考虑 从 结 点 集合 S 到 结 点 集合 了 的 边 的 
容量 累积 。 与 每 一 条 边 的 流量 不 能 超过 容量 类 似 , 图 上 的 流量 不 能 超过 图 中 任意 割 的 容 
量 。 这 意味 着 , 如 果 需 要 在 图 上 找 出 其 最 大 的 流量 , 只 需要 求 得 图 中 所 有 制 中 容量 最 小 
的 值 便 可 以 确定 最 大 流 。 

以 上 的 结论 就 是 “最 大 流 最 小 割 ” 定理 。 割 的 容量 就 好 比 图 上 的 拐点 ,这些 拐 点 的 容 
量 大 小 不 一 。 如 果 知 道 其 中 最 小 的 那个 拐点 , 就 可 以 确定 这 个 图 上 流量 容许 的 最 大 值 。 
那么 求 最 大 流 问题 就 可 以 转化 成 求解 最 小 割 问题 。 

在 实际 的 求解 图 中 最 大 流 时 ,采用 的 是 逐步 逼近 法 。 从 源 点 s 到 目的 地 点 t, 找 出 一 
条 路 径 ， 确 定 该 路 径 上 可 行 流量 的 最 大 值 。 然 后 依次 找 出 各 条 路 径 , 直到 流量 不 能 再 增 
长 为 止 。 以 图 10.3(a) 为 例 , 可 以 先 假定 图 中 各 边 的 流量 为 0, 然后 找到 一 条 从 源 点 到 目 
的 点 的 路 径 s 一 u 一 x 一 y 一 t, 该 路 径 上 可 行 的 最 大 流量 等 于 2。 当 我 们 继续 尝试 找 从 
结 点 s 到 t 可 扩展 容量 的 路 径 时 ,发 现 这 样 的 路 径 并 不 存在 , 如 图 10.3(b) 所 示 。 从 结 点 





图 10.3 逐步 逼近 法 找 最 大 流 
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s 到 结 点 u, 流量 已 经 等 于 容量 ; 从 结 点 s 到 x, 流量 可 以 扩展 3, 但 结 点 x 之 后 就 不 能 继 
续 扩展 流量 了 。 

根据 逐步 逼近 的 方法 找 最 大 流 , 得 到 图 10.3(a) 的 最 大 流 为 2。 然而 , 该 图 的 最 大 流 
应 为 4, 即 路 径 s 一 一 v 一 t 这 条 路 径 上 的 流量 为 2; 而 s 一 x 一 y 一 t 这 条 路 径 上 的 
流量 也 为 2。 

那 我 们 该 如 何 继续 寻找 可 以 扩展 的 路 径 呢 ?这 里 用 到 的 方法 就 是 回 退 法 ， 
图 10.3(b) 的 结 点 u 为 例 , 可 以 将 原来 从 u 到 x 的 流量 从 2 变 为 0, 流入 结 点 eh 
依然 是 2。 根据 流量 保存 条 件 ， 从 u 到 v 的 流量 应 为 2, 得 到 如 图 10.4(a) 所 示 的 流量 图 。 
这 时 就 可 以 再 找到 一 条 路 径 s 一 x 一 y 一 t, 在 该 路 径 上 可 以 增加 2 个 单位 的 流量 。 





四 


图 10.4 回 退 增加 了 扩大 容量 的 可 能 


以 上 分 析 表 明 , 为 了 能 逐步 增加 可 行 的 流量 ， 需 要 有 能 让 已 有 流量 实现 “ 回 退 ” 的 方 
法 。 可 以 实现 “ 回 退 ” 的 流量 图 称 为 剩余 流量 图 (Residual Graph), 该 图 可 以 辅助 寻找 
可 行 的 增 广 路 径 , 用 于 扩展 流量 。 

如 图 10.5(a) 所 示 , 从 结 点 u 到 x, 假定 其 容量 为 c, 流量 为 f。 那么 该 图 对 应 的 剩余 
流量 图 中 , 结 点 到 x 还 可 以 允许 的 流量 为 c 一 了 , 结 点 Xx .到 u 允许 回 退 的 流量 则 是 f。 
以 图 10.3(b) 为 例 , 可 以 得 到 如 图 10.5(b) 所 示 的 剩余 流量 图 。 可 以 从 剩余 流量 图 中 发 现 
存在 路 径 s 一 x 一 u 一 Vv 一 t, 该 条 路 径 还 可 以 扩展 的 流量 为 2。 需要 特别 注意 的 是 , 剩余 
流量 图 10.5(b) 中 , 存在 从 结 点 x 到 的 边 , 而 实际 的 输入 图 G (图 10.3(a)) 中 并 不 存 
在 这 条 边 。 剩余 流 图 中 , 这 条 边 的 目的 是 为 了 回 退 从 u 到 x 的 流量 , 回 退 的 数量 为 2, 意 
味 着 取消 从 u 到 x 的 原 输入 流量 。 


5 


剩余 流量 图 剩余 流量 图 
(a) (b) 














图 10.5 剩余 流量 图 
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最 大 流 问 题 有 一 些 非常 有 意思 的 等 价 描述 。 如 果 7 是 最 大 流 , 那么 意味 着 此 时 剩余 
流量 图 Gy 上 没有 可 扩展 的 路 径 。 如 果 还 存在 可 扩展 的 路 径 , 则 意味 着 流量 还 可 以 增加 ， 
这 与 上 是 最 大 流 的 假设 矛盾 。 因此, 如果 剩 余 流 图 不 再 有 可 扩展 的 路 径 , 这 时 得 到 的 流 
量 就 是 最 大 流 。 

如 果 剩 余 流量 图 Gi; 上 没有 可 扩展 的 路 径 , 那么 s 到 t 的 割 上 容量 等 于 流量 ， 即 
|fl=e(S, T), 这 就 是 著名 的 最 大 流 最 小 制定 理 ， 下 面 我 们 简单 证 明 这 个 结论 。 

假定 当 流量 为 f 时 ,Gy 不 能 再 进一步 扩展 , 如 图 10.6 所 示 。 定 义 结 点 集合 S 为 从 
初始 结 点 s 可 达 的 所 有 结 点 集 {ueEV}。 结 点 集 T=V 一 S, 也 就 是 除了 结 点 集 $ 外 剩余 的 
其 他 结 点 。 由 于 seS, teT, 因此 (S, T) 是 一 个 割 。 


Gj 中 的 路 径 全 让 


图 10.6 ”最 大 流 、 最 小 割 关 系 

















考虑 结 点 ueS 和 veT。 此 时 , 必 有 cy(u, v)=0, 也 就 是 结 点 u 到 v 的 容量 等 于 0。 
如 果 cy(u, v) 取 0, 那么 则 意味 着 ve S, 而 不 是 假设 的 v 属于 T。 因 此 , 从 结 点 u 到 结 点 v 
应 该 没有 剩余 容量 了 。 由 于 在 剩余 流 图 Gy 中 有 cr(u V)=c(u, Vv) 一 f(u, v)， 意 味 着 c(u， 
V)= f(u, vw)。 对 于 在 集合 $ 中 所 有 的 结 点 ueS, 和 在 T 中 所 有 结 点 ve T, 把 它们 全 部 
累加 , 可 得 f(S, T)=c(S, T), 也 就 是 最 大 流 等 于 割 (S, T) 上 的 容量 。 


10.2.1 Ford-Fulkerson 算法 


1956 年 , L.R.Ford 和 D.R.Fulkerson 提出 了 一 个 求 最 大 流 的 算法 (Ford-Fulkerson 
算法 ), 该 方法 的 思想 就 是 在 剩余 流量 图 中 寻找 可 扩展 路 径 ， 从 而 逐步 增加 流量 ,直到 剩 
余 流 量 图 中 没有 从 源 点 到 目的 点 的 可 扩展 路 径 为 止 。 该 算法 的 基本 步骤 为 : 

。 对 所 有 的 边 将 其 流量 值 置 为 0 

。 从 剩余 容量 图 Gy 选择 一 条 从 源 点 s 到 目的 点 t 的 路 径 P 

一 对 流量 图 G, 扩展 路 径 P 上 允许 的 最 小 流量 
一 直到 Gj 上 不 存在 从 源 点 s 到 目的 点 t 的 路 径 

以 上 算法 在 扩展 路 径 P 上 允许 的 流量 时 , 选择 了 P 上 允许 的 最 小 流量 进行 扩 
展 , 这 其 实 是 一 种 贪心 的 策略 。 因此 ，Ford-Fulkerson 算法 也 可 以 看 作 是 贪心 算法 ( 见 
第 8 章 )。 

但 是 ，Ford-Fulkerson 最 大 流 算法 在 某 些 情况 下 效率 会 非常 低 。 如 图 10.7 所 示 , 该 
图 的 最 大 流 为 2 x 109。 按照 Ford-Fulkerson 算法 ,找到 第 一 条 扩展 路 径 为 sa 一 b 一 t， 
这 条 路 径 可 扩展 的 流量 为 1, 如 图 10.7(b) 所 示 。 扩展 流量 1 后 得 到 图 10.7(c) 所 示 的 流 
图 , 以 及 图 10.7(d) 所 示 的 剩余 流 图 。 
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根据 如 图 10.7(d) 所 示 的 剩余 流 图 , 找到 可 扩展 路 径 为 s 一 b 一 a 一 t， 这 条 路 径 可 扩 
展 的 流量 依然 是 1。 从 而 得 到 如 图 10.7(e) 所 示 的 流 图 ， 以 及 如 图 10.7(f) 所 示 的 剩余 








剩余 流量 图 Gy 
10? 0 
10? 10° 
(b) 





(q) 





图 10.7 Ford-Fulkerson 算法 效率 慢 的 示例 


从 以 上 计算 不 难 发 现 ， 按照 Ford-Fulkerson 算法 计算 如 图 10.7(a) 所 示 的 最 大 流 的 
过 程 中 , 可 能 总 是 在 Gy 中 选择 了 a 和 b 这 两 个 结 点 之 间 的 连接 ， 从 而 每 次 只 能 扩展 1 
个 单位 流量 。 依 此 过 程 进行 扩展 ， 需 要 O(109) 步 才能 计算 出 该 图 的 最 大 流 。 

如 果 在 剩余 流 图 G: 上 寻找 第 一 条 从 源 点 s 到 目的 点 t 的 路 径 时 ,就 选择 了 路 径 
s 一 a 一 t， 那么 可 以 在 第 一 次 就 将 流量 扩展 为 109。 这 意味 着 只 需要 2 步 计算 就 可 以 求 得 
如 图 10.7(a) 所 示 的 最 大 流 。 下 面 我 们 介绍 另 一 个 改进 的 最 大 流 算法 , 该 算法 可 以 提高 
Ford-Fulkerson 算法 的 效率 。 


10.2.2” ”Edmond-Karp 算法 


Edmonds 和 Karp 在 Ford-Fulkerson 算法 基础 上 改进 了 最 大 流 算法 , 他 们 的 思想 非 
常 简单 ,就 是 在 Gy 上 寻找 可 扩展 路 径 时 ,总 是 按照 宽度 优先 原则 来 得 到 可 扩展 路 径 。 

我 们 在 7.4 节 已 经 知道 , 如 果 给 定 各 个 边 的 权重 均 为 1 的 图 , 那么 按照 BFS 寻找 从 
源 点 s 到 目的 点 t 的 路 径 时 , 可 以 得 到 从 s 到 t 的 最 短路 径 。 也 就 是 说 ，Edmond-Karp 
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算法 在 确定 s 到 t 的 可 扩展 路 径 时 , 选择 了 从 s 到 t 的 最 短路 径 。 

同样 以 图 10.7 为 例 。 按照 BFS, 源 点 为 s; 第 一 层 的 结 点 为 a 和 b, 第 二 层 的 结 点 为 
t。 因 此 , 按 BFS 选择 从 s 到 的 路 径 应 该 是 s 一 a 一 t 或 者 s 一 b 一 t。 按照 Edmonds 
和 Karp 的 算法 , 不 妨 设 第 一 次 从 剩余 流 图 Gy 可 扩展 的 路 径 是 s 一 a 一 t， 则 可 扩展 的 
流量 为 109。 第 二 次 可 扩展 的 路 径 是 s 一 b 一 t, 可 扩展 的 流量 为 109。 经 过 两 步 扩 展 , 就 
能 求 得 图 10.7(a) 所 示 的 最 大 流 。 因 此 ，Edmond-Karp 经 过 这 一 点 优化 , 就 大 大 提高 了 
最 大 流 算法 的 效率 。 





代码 10.1 Edmond-Karp 最 大 流 算法 





def EdmondsKarp(E, C, s, t): 
n= len(C) 
flow = 0 
F = [[0 for y in range(n)] for x in range(n)] 
while True: 
P= [-1 for x in range(n)] 
P[s] = -2 
M= [0 for x in range(n)] 
M[s] = float("Inf") 
BFsq = [] 
BFSq.append(s) 
pathFlow, P = BFS(E，C，s，t，F，P，M，BFSq) # 根据 宽度 优先 从 中 找到 可 
一 ”扩展 路 径 以 及 扩展 的 流量 
if pathFlow == 0: 


break 
flow = flow + pathFlow # 扩展 流量 

备 ' 王 .省 

while v != s: # 修改 剩余 流量 图 
u= P[v] 


Fr[u] [v] = F[u] [v] + pathFlow 
F[v] [ul = F[v] [u] - pathFlow 
v=1u 


return flow 





Edmond-Karp 的 实现 见 代 码 10.1, 输入 变量 也 为 边 的 权重 矩阵 ，C 为 各 边 的 容量 
和 矩阵, s 为 源 点 ,t 为 目的 点 。 输 出 How 为 最 大 流 值 。 代码 第 3 行将 How 流量 初始 化 为 0。 
第 4 行 变量 了 为 剩余 容量 矩阵 , 初始 化 各 个 值 为 0。 第 5 行 的 外 循环 直到 变量 pathFlow 
等 于 0 为 止 , 也 就 是 直到 没有 可 扩展 的 路 径 就 跳出 循环 。 代 码 第 12 行经 由 BFS 寻找 一 
条 可 以 扩展 的 路 径 , 函数 BFS ( 见 代码 10.2) 从 所 有 可 扩展 的 路 径 中 选择 一 条 从 源 点 到 
目的 结 点 路 径 最 短路 径 P 作为 返回 路 径 。 这 点 是 Edmond-Karp 算法 与 Ford-Fulkerson 
算法 最 大 的 不 同 之 处 。 代 码 10.1 第 17 行 的 循环 是 在 流量 扩展 后 , 修改 扩展 路 径 上 流量 
的 变化 。 


和 
和 
总 
4 
5 
6 
7 
8 
9 
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代码 10.2 按照 BFS 寻找 可 扩展 路 径 





def BFS(E，C，s，t，F，P，M，BFSq) : 
while (len(BFSq) > 0): 
u = BFSq.pop(0) 
for v in E[u]: 
if Crul[v] - Fru]l[v] > 0 and P[v] == -1: 
P[v] = u 
M[v] = min(M[u], Clu] [v] - Fru] [v]) 
if v I= t: 
BFSq.append(v) 
else: 
return M[t] ，P 
return 0，P 


Edmond-Karp 算法 的 执行 时 间 为 O(|V||Bl?), 其 中 |B| 和 |V| 分别 为 输入 图 G 的 
边 数 与 结 点 数 。 以 上 结果 的 证 明 过 程 较为 复杂 , 但 我 们 将 给 出 其 证 明 过 程 的 框架 流程 。 
首先 , 按照 代码 10.1 第 12 行 找 出 的 可 扩展 路 径 长 度 是 单调 递增 的 。 这 意味 着 每 一 次 循 
环 内 , 需要 O(|E|) 次 确定 可 扩展 路 径 。 其 次 , 图 上 的 每 一 条 边 卫 取 其 最 小 值 在 扩展 路 径 
上 ,最 多 会 出 现 O(|V|) 次 。 而 输入 图 有 O(| 媚 |) 个 结 点 对 , 这 意味 着 Edmond-Karp 算法 
要 经 过 O(|V||B|) 次 循环 。 因此 ，Edmond-Karp 算法 的 执行 时 间 复杂 度 为 O(IV||B|?)。 
而 Ford-Fulkerson 算法 的 执行 时 间 复 杂 度 为 O(|E|fr7), 其 中 f* 为 最 大 流 。 因此 ， 当 图 
总 体 规模 不 大 , 而 最 大 流 值 f* 很 大 时 , 采用 Edmond-Karp 算法 求解 最 大 流 的 效率 要 高 
于 Ford-Fulkerson 算法 。 


10.3 ”最 大 流 算 法 的 应 用 


最 大 流 算法 可 以 用 来 求解 许多 的 优化 问题 , 其 中 的 关键 便 是 将 具体 的 问题 转化 为 在 
图 中 求 最 大 流 的 问题 。 下 面 将 通过 两 个 示例 来 向 读者 展示 最 大 流 算法 的 具体 应 用 。 


10.3.1 二 向 图 最 大 匹配 问题 


一 家 软件 开发 公司 有 mn 个 项 目 经 理 ， 该 公司 最 近 接 了 mm 个 项 目 , 公司 需要 为 每 一 个 
项 目 安排 一 位 项 目 经 理 负责 项 目 进度 。 假 定 每 位 项 目 经 理 只 熟悉 其 中 部 分 项 目的 业务 ， 
现在 的 目标 是 要 实现 项 目 与 项 目 经 理 最 大 的 匹配 。 

最 大 匹配 意味 着 每 位 项 目 经 理 只 对 应 一 个 项 目 , 配对 数 为 M, 此 时 不 能 通过 改变 配 
对 关系 获得 超过 M 的 配对 数 。 如 图 10.8 所 示 , 根据 配对 关系 可 得 3 个 配对 , 即 a:1, c:3 
和 d:5。 然而 , 3 个 配对 并 非 最 大 配对 数 , 这 是 因为 还 存在 a:2, b:1, d:3 和 e:5 这 4 个 配 
对 。 图 10.8 所 示 的 最 大 匹配 数 为 4, 这 时 不 能 通过 改变 配对 关系 获得 超过 4 的 配对 数 。 
因此 , 4 就 是 图 10.8 所 示 配 对 关系 下 的 最 大 匹配 数 。 
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对 以 上 问题 , 我 们 首先 考虑 用 图 来 进行 建 模 。 每 一 位 项 目 经 理 用 结 点 集合 A 表示 ， 
而 每 一 个 项 目 则 用 结 点 集合 B 表示 。 如 果 项 目 经 理 ae A 熟悉 项 目 le B 和 项 目 2e B 
的 业务 , 则 结 点 a 与 结 点 1、2 相连 接 , 如 图 10.8 所 示 。 假如 每 位 项 目 经 理 熟 悉 所 有 项 目 
的 业务 , 那么 这 个 问题 非常 简单 ， 只 需要 让 经 理 a 负责 项 目 1, 经 理 b 负责 项 目 2, 依 此 
类 推 , 可 以 让 每 一 个 项 目 都 有 一 个 负责 人 。 问题 困难 在 于 , 每 位 项 目 经 理 只 熟悉 部 分 项 
目的 业务 , 我 们 并 不 一 定 能 为 每 一 个 项 目 都 找到 负责 人 , 但 我 们 期 望 为 尽 可 能 多 的 项 目 
找到 负责 人 。 

以 上 问题 可 以 通过 二 向 图 来 进行 建 模 。 那么 以 上 问题 就 等 价 于 , 给 定 二 向 图 G=(AU 
B, E), 寻找 边 的 集合 使 得 其 中 的 匹配 边 数 最 大 。 

对 于 二 向 图 问题 可 以 考虑 将 其 转化 为 最 大 流 问 题 进 行 求解 ， 即 从 结 点 集 A 到 结 点 
集 B 的 最 大 流量 。 为 此 , 需要 先 增加 原 匹 配 关系 图 中 的 源 点 和 目的 点 。 得 到 的 转化 过 程 
如 下 : 

。 按照 是 否 熟 悉 项 目 业 务 , 建立 从 结 点 集 A 到 结 点 集 B 的 有 向 边 

。 新 增加 出 发 结 点 s, 并 新 增 从 该 结 点 到 所 有 A 中 结 点 的 边 

。 新 增加 目的 结 点 t, 并 新 增 B 中 结 点 到 结 点 t 的 边 

。 图 中 每 一 条 边 的 容量 设 为 1 

由 于 结 点 之 间 是 否 连接 只 有 两 种 可 能 , 连接 或 不 连接 , 这样 就 可 以 设 图 上 的 容量 均 
为 1, 得 到 如 图 10.9 所 示 的 图 结构 。 这 意味 着 将 原来 求 图 10.8 所 示 的 最 大 匹配 数 问题 ， 
转化 为 求 如 图 10.9 所 示 的 最 大 流 问题 。 

















Eee js 





B 
图 10.8 项 目 经 理 与 项 目 图 10.9 二 向 图 最 大 匹配 转化 为 最 大 流 问题 


在 图 10.9 所 示 的 最 大 流 路 径 中 ,A 中 结 点 的 出 路 最 多 一 条 , 而 B 中 各 结 点 最 多 只 
能 有 一 条 入 径 。 这 一 点 可 以 从 图 10.9 中 很 容易 看 出 ,A 中 结 点 只 有 1 个 单位 流量 流入 
因此 只 能 有 一 条 出 去 的 流量 。 同 理 , B 中 结 点 只 有 1L 个 单位 流量 流出 , 因此 只 能 有 1 个 
单位 流量 流入 。 
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图 10.9 中 各 条 边 的 容量 均 为 1， 下面 我 们 按照 Edmond-Karp 算法 来 求 其 最 大 流 。 
首先 ,根据 图 10.9 按照 BFS 找到 从 源 点 s 到 目标 结 点 t 的 最 短路 径 s 一 a 一 1 一 t， 如 
图 10.10(a) 所 示 。 该 条 路 径 上 能 扩展 的 流量 为 1, 扩展 后 的 剩余 流 图 如 10.10(b) 所 示 ， 
其 中 路 径 s 一 a 一 1 一 t 的 点 画 线 为 扩展 后 剩余 流 路 径 。 再 根据 如 图 10.10(b) 所 示 的 剩余 
流 图 , 经 由 BFS 算法 , 找到 下 一 条 可 扩展 路 径 s 一 c 一 3 一 t,， 这 条 路 径 上 可 扩展 的 流量 也 
为 1， 如 图 10.10(b) 所 示 。 

















图 10.10 二 向 图 最 大 匹配 的 计算 示意 图 


根据 Edmond-Karp 算法 ,最 后 不 难得 到 如 图 10.10(f) 所 示 的 剩余 流 图 。 该 剩余 流 
图 不 再 有 可 扩展 路 径 ， 可 得 图 10.9 的 最 大 流 f=4, 意味 着 图 10.8 的 最 大 匹配 数 就 是 4。 
匹配 关系 就 是 剩余 流 图 10.10(f) 对 应 的 流 图 , 在 将 该 流 图 上 的 源 点 s 和 目标 点 t 删除 后 ， 
如 图 10.8 所 示 。 


10.3.2 ”文件 传输 中 的 不 重合 边 问题 


假设 现在 需要 在 网 络 中 传输 两 个 不 同 的 文件 , 文件 均 从 出 发 点 s 发 往 终 结 点 t 为 
了 避免 在 网 络 中 可 能 出 现 的 拥堵 , 要 求 两 个 文件 在 传输 过 程 中 经 过 的 路 径 没 有 重合 。 如 
果 是 需要 传输 个 文件 ， 则 需要 找 出 条 没有 重合 边 的 路 径 。 如 图 10.11 所 示 , 其 中 有 
二 2 条 没有 重合 边 的 路 径 , 一 条 为 图 中 虚线 所 示 的 路 径 , 另 一 条 则 为 点 画 线 所 示 的 
路 径 。 

这 个 问题 我 们 同样 可 以 利用 最 大 流 算法 求解 。 首先, 需要 考虑 如 何 把 这 个 问题 转换 
成 一 个 最 大 流 问题 。 假 设 给 定 有 向 图 G, 该 图 中 存在 从 初始 结 点 s 到 目的 结 点 t 的 大 条 
没有 重合 边 的 路 径 。 如 果 每 一 条 路 径 上 流 过 1 个 单位 的 流量 , 那么 该 图 有 大 个 单位 流量 
从 结 点 s 流出 ,个 单位 流量 流入 结 点 t。 该 流量 满足 流量 图 的 三 个 限制 条 件 。 
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图 10.11 文件 传输 中 两 条 不 重合 边 的 路 径 





因此 , 为 了 将 以 上 文件 传输 问题 转换 为 最 大 流 问 题 , 需要 证 明 以 下 结论 , 即 : 
流量 到 路 径 的 转换 


给 定 有 向 、 单 位 容量 图 G。 如 果 存 在 大 个 单位 的 流量 , 那么 则 及 条 不 重合 边 的 路 径 。 

下 面 将 通过 数学 归纳 法 证 明 以 上 结论 。 与 二 向 图 问题 类 似 , 每 一 条 边 的 容量 为 1, 其 
可 行 的 流量 为 0 或 者 1。 也 就 是 说 , 每 一 条 边 要 么 有 1 个 单位 流量 通过 , 要 么 没有 。 当 
二 1 时, 只 有 一 条 从 s 到 的 路 径 ， 且 该 路 径 上 每 条 边 的 流量 为 1， 显 然 结 论 成 立 。 不 
妨 设 当 也 < 天 时 ， 以 上 结论 依然 成 立 。 下 面 将 证 明 当 f = 上 时, 该 结论 依然 成 立 。 

假设 边 (s, u) 上 有 1 个 单位 流量 流 过 , 由 最 大 流 的 性 质 知 从 u 应 该 有 一 个 单位 的 流 
量 流出 。 再 从 u 出 发 寻找 1 个 单位 流量 路 径 时 ,存在 两 种 可 能 的 情况 。 一 种 情况 是 , 依 
此 可 以 获得 达到 目的 结 点 t 的 路 径 , 该 路 径 上 各 边 的 流量 为 1。 不妨 将 该 条 路 径 的 流量 
置 为 0, 那么 剩余 的 流量 应 该 为 大- 1。 根据 归纳 假设 , 当 f < 大 时, 图 中 存在 f 条 不 重 
合 边 的 路 径 。 因此 , 此 时 将 原来 置 为 0 的 路 径 加 入 进去 , 则 最 大 流 为 k， 且 不 重合 边 数 也 
为 。 

另外 一 种 情况 是 , 不 能 找到 直达 目标 点 t 的 路 径 , 而 是 回 到 曾经 经 过 的 结 点 , 这 种 
情况 意味 着 路 径 上 存在 环 。 如 图 10.12(a) 所 示 , 该 图 最 大 流 等 于 3。 从 源 点 s 出 发 , 其 
路 径 为 s 一 c 一 b 一 d 一 e 一 c， 意味 着 回 到 原来 曾经 经 过 的 结 点 c, 如 图 10.12(b) 所 示 。 此 
时 ，c 一 b 一 qd 一 e 一 c 构成 环 。 如 果 将 这 个 环 上 的 流量 置 为 0, 那么 原 图 的 最 大 流量 依然 是 
3， 如 图 10.12(c) 所 示 。 

这 意味 着 在 第 二 种 情况 下 , 当 置 环 的 路 径 上 的 流量 为 0 后 , 图 的 流量 依然 为 k。 再 依 
照 第 一 种 情况 可 以 证 明 最 大 流 为 k, 则 图 中 存在 条 不 重合 边 的 路 径 。 因此, 命题 得 证 。 

以 上 证 明 过 程 实际 也 表明 了 如 何 从 图 G 中 寻找 满足 条 件 的 路 径 , 即 : 

(1) 求 出 图 G 的 最 大 流 ; 

(2) 从 初始 结 点 s 开始 , 按照 流 图 遍历 路 径 ， 

(3) 如 果 在 达到 目的 结 点 t 之 前 ， 遇 到 环 ， 则 将 属于 该 环 的 边 的 流量 置 为 0; 

(4) 到 达 t 后 , 输出 从 s 到 的 路 径 ; 

(5) 重复 第 二 步 , 直到 s 出 发 的 每 一 条 可 行 流 路 径 均 已 经 遍历 过 。 

以 上 算法 的 另外 一 个 应 用 就 是 寻找 如 何 最 快 地 切断 两 地 的 通信 。 比 如 , 已 知 城市 A 
与 城市 B 之 间 通 信和 网络 结构 , 那么 最 少 需要 剪 切 掉 哪 些 结 点 间 的 连接 才能 彻底 让 这 两 座 
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图 10.12 发 生 循环 情况 的 示意 图 


城市 之 间 的 通信 瘫痪 ? 根据 以 上 证 明 结果 不 难 知道 , 最少 剪 切 的 边 数 就 等 于 从 结 点 A 到 
结 点 B 的 最 大 流量 , 这 里 假设 每 一 条 边 的 流量 要 么 等 于 0、 要么 等 于 1。 


10.4 小结 


最 大 流 理论 是 由 Ford 和 Fulkerson 于 1956 年 创立 的 , 他 们 指出 最 大 流 的 流 值 等 于 
最 小 割 ( 截 集 ) 的 容量 这 个 重要 的 事实 ， 并 根据 这 一 原理 设计 了 用 逐步 扩展 求 最 大 流 的 
方法 。 后 来 , Bdmonds 和 Karp 等 人 加 以 改进 , 使 得 求解 最 大 流 的 方法 更 加 丰富 和 完善 。 
最 大 流 问 题 的 研究 密切 了 图 论 和 运筹 学 , 特别 是 与 线性 规划 的 联系 , 开辟 了 图 论 应 用 的 
新 途径 。 

在 求解 给 定 图 的 最 大 流 时 , 读者 要 特别 注意 流量 与 容量 的 区 别 。 尤 其 是 , 流 图 和 剩 
余 流 图 之 间 的 异同 , 理解 剩余 流 图 中 的 边 并 非 真 实 流 图 中 实际 存在 的 边 , 而 是 为 了 回 退 
而 存在 的 一 条 虚拟 的 边 。 

现实 中 的 问题 采用 最 大 流 算法 求解 时 , 最 大 的 困难 来 自如 何 将 原 问题 转化 为 最 大 流 
问题 。 在 问题 转换 时 需要 特别 注意 结 点 的 物理 意义 ,以 及 始点 和 终点 的 设 定 。 





课 后 习题 
习题 10-1 有 n 头 牛 , 有 了 种 食物 和 4 种 饮料 , 每 个 牛 喜欢 一 个 或 多 个 食物 和 饮料 , 但 
是 所 有 的 食物 和 饮料 每 种 都 只 有 一 个 , 问 最 多 可 以 满足 多 少 头 牛 的 需要 ? 


习题 10-2 一 个 人 有 好 几 猪 圈 的 猪 , 给 你 猪 圈 中 猪 的 个 数 。 这 个 人 自己 没有 猪 圈 的 钥 
匙 。 现 在 他 知道 有 一 些 顾客 要 来 买 猪 , 他 们 会 带 来 一 些 猪 圈 的 钥匙 。 这 样 他 就 可 以 打开 
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猪 围 并 卖 给 顾客 猎 , 在 这 过 程 中 他 可 以 调换 这 几 圈 猪 中 的 猪 。 设计 一 个 算法 求 他 最 多 可 
以 卖 出 多 少 猪 。 

习题 10-3 ”有 一 块 地 , 分 成 nx m 块 。 有 的 块 上 长 着 草 , 有 的 块 上 是 落地 。 将 任何 一 块 
长 着 草 的 块 上 的 草 拔 掉 都 需要 花费 4 个 力气 ， 往 任何 一 块 营地 上 种 上 草 都 需要 花费 了 个 
力气 ， 在 草 和 荒地 之 间架 一 个 管 得 需要 花费 个 力气 ， 如 果 一 块 草地 四 周 都 是 芒 地 ， 则 
得 花 掉 46 个 力气 。 现在 , 要 求 最 外 一 图 都 种 上 草 , 草地 与 荒地 之 问 要 用 息 矢 隔 开 ， 最 少 
需要 花费 多 少 个 力气 ? 








第 11 章 随机 算法 


本 章 学 习 目 标 
。 了 解 两 种 典型 的 随机 算法 ， 即 蒙特 卡 洛 和 拉 斯 维 加 斯 算法 的 异同 
。 熟练 掌握 利用 随机 算法 求 典型 计算 问题 
。 了解 随机 快速 排序 算法 时 间 复 杂 度 分 析 过 程 


11.1 引言 


当 读 者 在 参加 考试 遇 到 一 道 选择 题 并 不 知道 如 何 求解 时 ,是 放弃 该 题 的 作答 , 还 是 
会 随便 选择 一 个 呢 ? 大 部 分 读者 都 不 会 倾向 于 放弃 作答 ,因为 这 意味 着 该 题 你 的 得 分 必 
然 是 0。 往 往 大 部 分 人 倾向 于 随机 选择 一 个 选项 作为 解答 。 

如 果 只 有 2 个 选项 A 和 了 B, 到 底 该 选择 哪 一 个 
作为 最 终 的 解答 ? 这 可 以 通过 抛 硬币 的 方式 来 确定 
最 终 的 选项 〈 如 图 11.1)。 向 空中 抛 一 次 硬币 , 落地 
后 如 果 正 面 朝 上 则 选择 A, 否则 就 选择 B。 这 意味 
着 这 两 个 选项 各 有 50% 的 概率 被 选中 。 

在 利用 算法 求解 计算 问题 时 ， 也 会 用 到 随机 策 
略 ， 即 按照 一 个 概率 值 来 作出 选择 。 也 许 读者 会 有 图 11.1 通过 抛 硬币 来 进行 决策 
疑问 , 我 们 之 前 学 习 的 算法 每 一 步 都 是 确定 的 , 现 
在 引入 随机 策略 , 会 不 会 让 算法 的 执行 出 现 混乱 。 带 着 这 个 疑问 ， 本章 将 通过 一 些 具体 
的 示例 来 阐明 随 机 策略 在 算法 设计 中 的 作用 。 

一 般 将 随机 算法 分 为 两 类 , 各 自用 世界 有 名 的 赌 城 分 别 命名 ,它们 是 拉 斯 维 加 
斯 (Las Vegas) 和 蒙特 卡 罗 (Monte Carlo)。 这 两 类 随机 算法 是 在 算法 执行 效率 和 正确 
性 之 间 权 衡 的 结果 。 其 中 , 拉 斯 维 加 斯 算法 能 保证 结果 一 定 正确 , 但 算法 运行 时 间 只 能 
是 平均 情况 下 的 多 项 式 时 间 。 也 就 是 说 , 拉 斯 维 加 斯 算法 在 执行 过 程 中 并 不 能 总 是 保证 
其 执行 时 间 是 多 项 式 。 蒙特 卡 罗 算 法 则 不 同 , 该 算法 运行 时 间 总 是 多 项 式 时 间 , 但 是 其 





运算 结果 只 在 一 定 概率 下 正确 。 因此, 这 两 个 随机 算法 各 有 特点 ,到底 选 择 哪 个 算法 需 
要 根据 具体 问题 进行 选 定 。 


本 章 将 首先 介绍 如 何 利用 随机 算法 判断 矩阵 乘积 结果 ， 该 算法 是 一 个 典型 的 蒙特 卡 
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罗 算 法 ， 而 随机 的 快速 排序 则 是 拉 斯 维 加 斯 算法 的 应 用 。 最 后 , 还 将 介绍 随机 算法 在 先 
择 第 小 的 数 与 寻找 最 小 割 这 两 个 问题 中 的 具体 应 用 。 














11.2 ”和 矩阵 乘积 结果 验证 


给 定 两 个 nxn 矩阵 A 和 B, 它们 的 乘积 C=Ax 也 。 如 果 按 照 矩阵 乘法 公式 ,直接 
计算 C。 那么 C 中 每 一 个 元 素 都 需要 9B(n) 次 计算 ，C 中 共有 2 个 元 素 。 因 此 , 直接 计 
算 的 算法 效率 为 O(m3)。Strassen 在 1969 年 提出 可 以 利用 分 治 算法 改进 这 个 算法 , 其 算 
法 效率 为 O(n281)。 理 论 上 来 说 , 计算 Ax B 的 时 间 复 杂 度 最 高 能 提高 到 O(n2), 然而 如 
果 是 需要 验证 Ax B 是 否 等 于 某 个 已 知 的 矩阵 C, 那么 其 算法 效率 的 能 达到 O(n2) 吗 ? 

为 了 验证 Ax B 是 否 等 于 C, 直观 感觉 就 是 先 计算 出 Ax B=D, 然后 再 依次 比较 
D 和 C 是 否 相等 。 但 是 , 我 们 已 经 知道 计算 Ax B 目前 还 没有 O(n2) 的 算法 。 因 此 , 我 
们 考虑 的 方向 应 该 是 尽量 减少 Ax B 计算 的 次 数 。 可 以 先 让 矩阵 B 与 一 个 向 量 x 相 乘 ， 
其 中 x 是 n x1 大 小 的 向 量 。 Bx x 得 到 的 是 一 个 nn 行 1 列 向 量 , 且 其 时 间 复 杂 度 为 
O(n?)。 然后 再 用 A 乘 以 Bx x, 最 后 得 到 的 依然 是 nn 行 1 列 向 量 。 也 就 是 我 们 将 Ax B 
转换 为 A(Bx), 计算 A(Bx) 结果 的 时 间 复 杂 度 为 O(n2)。 

我 们 的 目的 是 验证 Ax B 是 否 等 于 C, 因此 现在 问题 变 成 验证 Ax Bx x 是 否 等 于 
Cx x。 不 妨 设 Ax B = D, 因此 有 以 下 两 种 情况 : 

。 如 果 D = C 成 立 , 那么 Dx x= Cxx 

e 如 果 D 关 C, 那么 Dx xCxx 

以 上 计算 通过 引入 一 个 新 的 变量 x, 简化 了 计算 , 从 而 可 以 在 O(n?) 的 时 间 内 判断 
AB 是 否 等 于 C。 但 是 , 如 果 我 们 仔细 分 析 第 二 种 情况 , 就 会 发 现 情况 似乎 并 没有 这 么 简 
单 。 这 是 因为 如 果 DD 关 C, 仍 有 可 能 使 得 Dx x = Cx x 成立, 这 一 点 可 以 从 图 11.2 看 
出 , 矩阵 C 和 D 除了 标 出 的 两 个 元 素 外 ,其 他 元 素 均 相 等 , 但 显然 由 于 这 两 个 元 素 不 相等 ， 
因此 C#F D。 然而 , 由 于 x 与 矩阵 C 和 D 中 3 和 1 对 应 的 元 素 均 为 1, 因此 有 Dx = Cx。 














x 
x 
[| | 

















图 11.2 和 插 阵 C 不 等 于 DD 


通过 引入 一 个 新 的 变量 提高 了 计算 效率 , 但 带 来 的 结果 是 判断 存在 错误 的 可 外 


E。 为 
了 减少 这 种 错误 , 可 以 随机 产生 x 中 的 元 素 , 比如 x 中 每 一 个 元 素 要 么 是 0、 要么 是 1。 
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到 底 选 择 其 中 的 哪 一 个 值 , 通过 抛 一 枚 硬币 来 决定 , 正面 朝 上 为 1,， 反面 朝 上 则 取 为 0。 
这 意味 着 每 一 个 元 素 取 为 1 的 概率 为 50%。 尽管 x 中 元 素 是 随机 产生 , 但 依然 不 能 排除 
当 Dz# C 时 , 存在 AB=C 的 可 能 。 那 么 发 生 这 种 情况 的 概率 是 多 少 呢 ? 

不 妨 设 D# C, 其 中 只 有 对 应 的 行 de D 与 ce C 不 相等 , D 和 C 中 其 他 行 元 素 都 
相等 。 在 行 d 和 行 c 中 元 素 di## ci。 如 果 x 中 元 素 是 随机 产生 , 那么 只 有 当 (d 一 c)x=0 
时 , 才 会 发 生 误 判 , 即 错 认为 D=C。 

下 面 考察 (d 一 c)x, 将 它 分 为 两 个 部 分 , 第 一 部 分 (di 一 ci)xi， 第 二 部 分 为 盖世 (4 
Fi 


cj)xj。 可 以 根据 y 和 x; 的 值 来 考察 (d 一 c)x， 即 

。 如 果 y=0。 那么 当 xi=1 时 ,由 于 di ci, 则 (dc)x 第 一 部 分 一 定 不 等 于 0, 显 
然 可 得 D# C; 而 当 xi=0 时 , 我 们 会 误 判 D=C。 

。 如 果 y 关 0。 那么 当 x;=0, 可 得 D 关 C; 而 xi=1 时 , 如 果 y=(d; 一 ci), 那么 还 是 会 

误 判 D=C; 而 当 y 关 (di 一 ci) 时 ， 则 不 会 发 生 误 判 。 

综合 以 上 的 分 析 , 问题 是 需 判断 AB = C 是 否 成 立 。 按照 前 面 介绍 的 通过 引进 一 
个 向 量 x, 可 以 判断 ABx 是 否 等 于 Cx 从 而 对 AB = C 是 否 成 立 判 断 。 其 中 , ABx=Cx 
是 否 成 立 的 输出 为 “Y”( 对 应 于 AB 等 于 C), 或 者 “N”(AB 不 等 于 C), 实现 见 代 
码 11.1。 如 果 输 出 为 “Y” 意味 着 得 到 正确 结果 , 即 AB = C; 而 当 输 出 为 “N”, 那么 将 
有 小 于 1/2 的 概率 AB=C, 也 就 是 发 生 了 误 判 。 














引 





代码 11.1 判断 矩阵 乘积 结果 是 否 相等 


import numpy as np 

def check_equal(A, B, C): 
size_matrix = A.shape 
x = np.random.randint (2，size=size_matrix[0]) # 随机 生成 0/1 向 量 x 
x.shape = (size_matrix[0],1) # 将 x 变 成 列 向 量 


D = A.dot(B.dot(x)) # D=A*(B*x) 

C= C.dot(x) # C=C#X 

for d,c in zip(D,C) : # 索引 D 和 C 中 每 一 个 元 素 
ine: 


return False 


return True 





因为 存在 误 判 的 可 能 , 似乎 不 能 得 到 正确 的 结果 。 那么, 代码 11.1 实现 的 算法 能 和 
到 正确 结果 吗 ? 这 里 可 以 通过 一 个 很 简单 的 办 法 来 提高 判断 结果 的 正确 率 , 即 “ 重 复 ” 
〈 见 代码 11.2)。 也 就 是 说 , 可 以 运行 次 如 代码 11.1 所 示 的 算法 ,由 于 每 次 产生 x 都 是 
相互 独立 的 , 那么 如 果 这 上 大 次 中 都 是 输出 “N” 这 意味 着 AB 了 关 C。 由 于 重复 运算 了 
次 , 因此 发 生 误 判 的 概率 为 1/2*, 也 就 是 随 着 重复 次 数 的 增加 , 误 判 的 概率 会 变 的 很 小 。 
同时 , 重复 上 次, 算法 复杂 度 仍然 是 O(n?)。 
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代码 11.2 重复 判断 提高 正确 的 概率 





if namne == "main ”2 
num = 10 # 矩阵 大 小 
A = np.random.rand(num,num) 
B = np.random.rand(num,num) 
C = np.random.rand (num,num) 


k = 20 # 重复 次 数 


if check equal(A, B, C): 
Print("AB is equal to C") 
else: “ # 如 果 AB 不 等 于 C, 则 再 重复 k 次 , 判断 它们 是 否 相等 
num_ false = 0 
for ik in range(k): 
if not check_equal(A，B，C) : 
num false += 1 
if num false == k: 
Print("AB is not equal to C") 
else: 


Pprint ("uncertain") 


代码 11.1 中 第 1 行 导 入 了 Python 中 最 为 常用 的 数值 计算 库 numpy (www.numpy.org)。 
代码 11.2 第 8 行 判 断 A(Bx) 是 否 等 于 Cx， 如 果 这 两 者 相等 ， 则 输出 AB 等 于 C。 否 
则 , 重复 调用 函数 check_equal( ) 共 上 次 , 从 这 次 判断 记录 下 函数 check_equal( ) 返回 
False 的 次 数 num_false。 当 num_false 等 于 大 次 时 ,， 则 输出 AB 不 等 于 C。 

矩阵 乘积 结果 验证 是 一 个 非常 典型 的 蒙特 卡 罗 算 法 随机 算法 。 这 是 因为 算法 是 以 一 
定 概率 获得 正确 结果 , 但 其 时 间 复 杂 度 是 多 项 式 时 间 。 但 需要 强调 的 是 , 通过 重复 , 可 以 
将 算法 获得 正确 解 的 概率 提高 到 一 个 可 以 接受 的 范围 。 


11.3 ”快速 排序 


本 节 我 们 将 学 习 一 个 使 用 频率 很 高 的 排序 算法 , 快速 排序 (Quick Sort) ,快速 排序 
鸭 实现 将 会 利用 随机 算法 。 快速 排序 与 第 5 章 介 绍 的 合并 排序 相似 , 也 可 以 看 作 是 分 治 
算法 。 
根据 分 治 算法 求解 问题 的 三 个 步骤 : 首先 , 假设 存在 策略 quick_sort( )， 它 可 以 对 
输入 序列 A 进行 排序 ; 其 次 ,将 输入 序列 根据 支点 数 (Pivot) 分 为 两 个 部 分 A_right 和 
A_left, 其 中 支点 数 就 是 从 输入 序列 A 中 选 出 的 某 个 元 素 ; 然后 , 利用 递归 , 也 就 是 利用 
策略 quick_sort( ) 来 完成 对 A_right，A_left 的 排序 ; 最 后 , 合并 排序 的 结果 , 得 到 有 序 
的 序列 A。 
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11.3.1 ”根据 支点 数 划 分 输入 序列 


粗略 地 看 , 似乎 快速 排序 和 合并 排序 没有 显著 的 区 别 。 其 实 不 然 , 这 两 个 算法 最 大 
的 不 同 就 是 在 分 解 部 分 。 合并 排序 算法 的 分 解 就 是 简单 的 划分 , 并 没有 涉及 到 计算 。 而 
快速 排序 是 根据 支点 数 进行 划分 ,划分 的 结果 是 支点 数 左边 部 分 的 数 均 小 于 等 于 该 支点 
数 ， 而 右边 部 分 的 数 均 大 于 该 支点 数 , 如 图 11.3 所 示 。 


Pivot 


A: <= > 


图 11.3 根据 支点 数 划分 后 的 结果 示意 图 








通过 一 次 划分 , 实际 就 是 找到 当前 的 支点 数 在 输出 序列 中 的 位 置 。 经 过 一 次 划分 
所 有 在 支点 数 左边 的 数 均 小 于 等 于 支点 数 , 支点 数 右边 的 数 都 大 于 支点 数 。 需要 注意 的 
是 , 左边 数据 之 间 的 相互 大 小 关系 并 没有 任何 限制 , 同时 支点 数 右边 部 分 的 数据 之 间 大 
小 关系 同样 没有 任何 限制 。 因 此 ， 需 要 进一步 处 理 划分 后 支点 数 左右 两 边 的 序列 。 由 于 
每 一 次 划分 就 能 找到 输入 序列 中 一 个 元 素 的 输出 位 置 , 因此 经 过 若干 次 划分 后 输入 序列 
就 成 为 了 一 个 有 序 的 输出 。 
那么 如 何 进行 划分 呢 ? 由 于 划分 的 目的 是 将 输入 数据 按照 选 定 的 Pivot 进行 重 排 ， 
且 大 小 关系 如 图 11.3, 可 以 使 用 以 下 步 又 来 完成 划分 (实现 见 代 码 11.3): 
(1) 将 选 定 的 pivot 数 放置 于 输入 序列 的 第 一 位 ; 
(2) 设 索 引 i= 0; 
(3) 从 了 =:i 二 1 开始 循环 序列 中 每 一 个 元 素 ; 
。 如 果 7 当前 索引 的 元 素 比 pivot 小 , 则 将 索引 i 右 移 一 位 , 然后 交换 当前 ; 指 
向 的 元 素 和 i 所 指向 元 素 的 位 置 , 将 7 右 移 一 位 
e 如 果 7 当前 索引 的 元 素 比 pivot 大 , 则 仅 将 了 右 移 一 位 即 可 
(4) 当 了 索引 到 元 素 最 后 一 个 元 素 后 , 交换 第 一 位 元 素 与 当前 i 指向 元 素 的 位 置 , 并 
返回 i。 


代码 11.3 按照 支点 数 划分 序列 





def partition(A,start,end): 
Pivot=randint (start ,end) 
temp=A [end] 
A[end]=A[pivot] 
A[pivot]=temp 
newPivotIndex=start-1 
for index in range(start ,end): 
if A[index]<A[end] : 
newPivotIndex=newPivotIndex+1 


temp=A [newPivotIndex] 
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A[newPivotIndex]=A[index] 
A[index]=temp 
temp=A [newPivotIndex+1] 
A[newPivotIndex+1]=A[end] 
A[end] =temp 


return newPivotIndex+1 





以 图 11.4 为 例 , 我 们 可 以 看 到 算法 利用 两 个 索引 i 和 了 来 记录 输入 序列 各 个 元 素 与 
支点 数 的 关系 , 算法 开始 时 索引 ; 指向 第 一 个 元 素 , 也 就 是 支点 数 , 而 了 指向 输入 序列 的 
第 二 个 元 素 。 如果 7 指向 的 元 素 大 于 支点 数 ， 则 移动 j 至 下 一 个 元 素 。 当 j 指向 的 元 素 
小 于 支点 数 时 (如 图 11.4(2) 所 示 ), 这 时 首先 将 i 向 右 移动 一 位 ， 并 交换 当前 i 和 了 所 
指向 元 素 的 位 置 , 也 就 是 序列 中 5 和 10 交换 位 置 。 这样 保 证 从 支点 数 右边 开始 直到 i 指 
向 的 各 个 元 素 , 它们 的 值 都 小 于 等 于 支点 数 。 而 从 第 i 十 1 到 第 7 位 元 素 都 大 于 支点 数 ， 
对 应 图 中 有 深 色 背景 单元 格 内 的 元 素 。 按照 以 上 算法 执行 直到 了 指向 输入 序列 的 最 后 
一 个 元 素 (图 11.4(7)), 交换 支点 数 6 与 当前 i 指向 的 元 素 2 的 位 置 , 得 到 图 11.4(8) 所 
示 的 结果 , 返回 当前 i 的 位 置 。 








(1) 10|1315|18|131211 




















图 11.4 根据 支点 数 划 分 的 算法 示意 


以 上 的 计算 过 程 与 合并 排序 的 另 一 个 不 同 ， 就 是 不 需要 额外 的 数组 。 因 此 从 这 个 角 
度 说 , 快速 排序 是 一 类 原 地 排序 算法 (Sort in Place)。 


11.3.2 ”选择 支点 数 


也 许 看 到 这 里 , 读者 会 奇怪 似乎 快速 排序 中 并 没有 出 现 随机 计算 。 其 实 , 快速 排序 
中 的 随机 是 用 于 挑选 支点 数 。 当 需要 确定 序列 中 哪个 元 素 作为 支点 数 时 ,是 通过 随机 的 
方式 来 选 定 的 。 每 一 个 元 素 被 选中 的 概率 相等 ， 至 于 谁 被 选中 , 可 通过 抛 硬币 的 方式 来 
决定 。 比 如 图 11.4 中 的 8 个 元 素 , 每 一 元 素 作为 支点 数 的 概率 1/8。 这 相当 于 有 8 个 相 
同 的 球 放置 于 密封 的 容器 内 , 每 一 个 球 有 一 个 编号 ， 编 号 对 应 于 输入 序列 元 素 的 位 置 索 
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引 ， 如 图 11.5 所 示 。 我 们 闭 着 眼睛 ,随机 的 从 容器 内 取出 一 个 球 , 该 球 上 的 编号 就 对 应 
取 为 支点 数 的 位 置 索引 。 

为 什么 需要 利用 随机 算法 来 选择 支点 数 ? 我 们 先 
考虑 一 种 极端 的 选择 支点 数 的 情况 ， 即 每 次 选 出 的 支 
点 数 , 一 端 总 是 没有 元 素 。 也 就 是 说 , 要么 所 有 的 数 都 
比 支点 数 小 , 要 么 所 有 的 数 都 比 支点 数 大 。 这 种 情况 
下 快速 排序 算法 的 时 间 复 杂 度 为 

T(n)=T(0)+T(n—1)+©O(n) 
=T(n—1)+QA(n) (11.D) 
图 11.5 随机 选择 支点 数 

如 图 11.6 所 示 , 通过 替换 法 不 难 计算 得 T(n) 二 
@(n2)。 也 就 是 说 ,这 种 情况 下 选 出 的 支点 数 ， 导 致 快速 排序 算法 的 效率 还 没有 合并 排序 

那么 支点 数 具 有 什么 样 的 特征 能 提高 算法 效率 呢 ? 我 们 可 以 将 支点 数 类 比 为 挑 担子 
的 支点 ， 如 果 读 者 挑 过 担子 ， 就 会 知道 挑 50kg 重 的 物品 , 前 后 担子 的 重量 相当 的 话 挑 起 
来 比较 省 力 , 也 就 是 说 前 后 篮 的 重量 均 为 25kg (如 图 11.7)。 如 果 所 有 的 重量 都 在 一 个 秒 
子 里 , 这 种 情况 下 当然 挑 起 来 就 非常 吃力 。 因此， 当选 出 的 支点 数 把 输入 序列 一 分 为 二 
的 时 候 , 直观 上 感觉 算法 效率 会 高 。 此 时 , T(n) = 2T(n/2) 十 9(n) = 96(nlogn)。 根 据 计 
算 可 知 ,我 们 的 直观 感觉 符合 预期 的 结果 , 即 选 出 到 支点 数 能 均匀 的 分 配 两 端 元 素 个 数 
时 ,其 算法 效率 得 到 了 提高 。 


T(n)=T(0)+T(n—1)+en 


9 2 ©(m) 
人 BS 








9(1) 








重量 


图 11.6 一 端 有 元 素 情况 下 算法 时 间 复 杂 度 计算 


根据 前 面 的 分 析 , 我 们 知道 合理 选择 支点 数 将 会 影响 快速 排序 算法 性 能 。 并 且 知 道 ， 
如 果 支 点 数 能 将 两 端的 数 划 分 的 大 致 相等 , 那么 快速 排序 算法 的 效率 为 6(nlogn), 我 
们 称 这 种 划分 是 幸运 划分 。 而 如 果 支 点 数 将 输入 序列 划分 后 ， 导 致 一 端 总 没有 元 素 ,其 
算法 效率 将 是 6(n2), 称 这 种 划分 是 不 幸运 划分 。 

如 果 支 点 数 的 两 端 元 素 个 数 的 比例 是 1/10 : 9/10, 这 种 情况 下 是 幸运 划分 还 是 不 幸 
运 划 分 呢 ? 这 种 划分 是 不 平衡 划分 , 一 端的 元 素 非常 多 ,而 另 一 端的 元 素 相 对 非常 少 。 也 
许 直观 来 看 , 这 种 划分 应 该 还 是 不 幸运 划分 。 然 而 , 这 一 次 的 直观 感觉 是 错误 的 , 因为 我 
们 将 证 明 此 种 情况 下 的 划分 其 算法 时 间 复 杂 度 仍然 是 @(nlogn)。 
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此 时 , 有 
CY 7( 二 中 下 7T(%n) +6() (11.2) 
式 (11.2) 的 计算 如 图 11.8 所 示 。 将 T(n) 按照 递归 式 展开 , 该 树 显 然 是 一 棵 不 对 
称 的 递归 树 。 假 设 该 树 的 左边 部 分 高 为 hi， 右边 部 分 高 为 ho。 左边 部 分 结 点 从 1/100m， 
1/10in, 1/102n,…, 1/10%mn 依次 变化 。 其中, 1/10%n = 1。 因此, hi = logiom。 
同 理 , 可 推 得 hs = loglo/em。 因 此 可 得 : 








cnlogion < T(n) < cnlogio/g +O(n) (11:3) 


这 意味 着 , T(n) = 98(nlogn)。 这 说 明 按 照 支 点 数 按照 1/10:9/10 比例 划分 输入 序 
列 , 快速 排序 算法 的 时 间 复 杂 度 仍然 是 6(nlogn)。 


1 
证 Cn 


logio 学 SN 


i 总 以 总 以 SA =------- Cn 
六 和 : 
el) \ 


6(1) 
cn logions T(n) cnlogio/on+ O(n) 





图 11.8 按 1/10:9/10 比例 划分 后 算法 时 间 复 杂 度 计算 


11.3.3 ”随机 快速 排序 


上 节 的 结果 表明 哪怕 是 按 1/10:9/10 比例 的 划分 ,都 是 幸运 划分 。 这 个 结论 对 随 
机 快速 排序 来 说 非常 重要 ， 意 味 着 随机 的 从 序列 中 选 出 一 个 支点 数 ， 并 不 需要 它 将 左 
右 两 端 均匀 的 一 分 为 二 ， 而 只 需要 能 按 1/10:9/10 比例 将 序列 一 分 为 二 ， 就 可 以 得 到 
O(nlogn) 的 排序 算法 。 因 此 , 我 们 得 到 如 下 所 示 的 随机 快速 排序 算法 流程 : 

(1) 从 输入 序列 中 随机 地 选择 一 个 支点 数 ; 

(2) 按照 选 出 的 这 个 支点 数 对 输入 序列 进行 划分 ; 

(3) 如 果 得 到 一 个 不 幸运 的 划分 , 也 就 是 有 一 个 部 分 数据 占 总 数 比 例 小 于 序列 的 
1/10, 那么 重复 第 (1) 步 , 直到 获得 一 个 幸运 的 划分 为 止 ; 

(4) 递归 处 理 划 分 后 得 到 的 两 个 子 序 列 。 

但 也 许 读者 还 会 有 疑问 ， 那 会 不 会 随机 选择 的 支点 数 总 不 能 得 到 一 个 幸运 划分 ， 从 
而 导致 不 停 地 选择 支点 数 。 也 就 是 以 上 算法 的 第 (3) 步 会 循环 很 多 次 ， 从 而 降低 算法 的 
时 间 效 率 。 下 面 我 们 将 分 析 , 按照 以 上 算法 可 以 得 到 一 个 O(nlogn) 时 间 复 杂 度 的 快速 
排序 算法 。 

假设 按照 以 上 算法 处 理 nn 个 数据 的 平均 时 间 复 杂 度 为 (mn), 这 个 时 间 应 该 包括 三 
个 部 分 : 
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。 处 理 划 分 后 左边 部 分 的 时 间 T(i) 
。 处 理 划 分 后 右边 部 分 的 时 间 T(n 一 让 
。 重复 选择 支点 数 的 平均 次 数 EE[#partitions] 乘 以 执行 划分 的 时 间 cn 
也 就 是 
T(n) < T(i) +T(n—i)+ EI[#partitions] x cm (11.4) 

















于 我 们 的 划分 总 是 要 得 到 一 个 幸运 划分 , 因此 ie [n/10, 9n/10]。 要 计算 T(n), 显 
然 需要 计算 忆 [#partitions]。 由 于 选择 支点 数 而 导致 不 幸运 划分 的 概率 很 低 , 只 有 2/10。 
因此 尽管 每 次 是 随机 选择 支点 数 , 得 到 幸运 划分 的 可 能 仍 有 8/10。 那 么 , 如 果 当 前 得 到 
一 个 不 幸运 划分 , 我 们 将 再 次 选择 一 个 新 的 支点 数 ， 那 我 们 平均 需要 重复 多 少 次 , 才能 
得 到 一 个 幸运 划分 呢 , 也 就 是 情 [#partitions] 等 于 多 少 ? 

我 们 说 忆 [#partitions] = 8/10。 就 好 比 你 有 一 个 硬币 , 随机 的 扔 1 次 它 8/10 的 概率 
正面 朝 上 , 那么 你 重复 扔 多 少 次 , 会 第 一 次 出 现 正面 朝 上 , 显然 需要 扔 10/8 次 , 也 就 是 
平均 下 来 不 超过 两 次 。 计 算出 B[#partitions] 后 , 式 (11.4) 就 可 以 通过 Master 法 求解 ， 
得 T(n) = O(nlogn)。 

随机 快速 排序 实现 见 代码 11.4, 正 是 由 于 得 到 不 幸运 划分 概率 很 小 , 因此 该 实现 中 
并 未 判断 划分 是 否 幸运 。 读 者 可 以 考虑 修改 其 实现 , 增加 划分 是 否 幸运 的 判断 。 











代码 11.4 快速 排序 算法 


from random import randint 
def inPlaceqQuickSort (A,start,end) : 
if start<end: 
pivot=randint (start ,end) # 随机 选择 一 个 支点 数 
temp=A [end] 
A[Lend]=A[pivot] 
A[pivot]=temp 


p=partition(A, start ,end) 
inPlaceQuickSort (A,start ,p-1) 
inPlaceQuickSort (A,p+1 ,end) 


# 按照 支点 数 划 分 A 
# 递归 处 理 左边 部 分 元 素 
# 递归 处 理 右边 部 分 元 素 





随机 快速 排序 是 一 个 典型 的 拉 斯 维 加 斯 算法 。 尽 管 选 择 支点 数 是 采用 随机 策略 ,但 
是 其 输出 结果 总 是 正确 ,也 就 是 选择 的 支点 数 能 得 到 幸运 划分 。 在 随机 快速 排序 中 , 牺 
牲 的 是 重复 选择 支点 数 的 时 间 。 但 是 , 由 于 总 能 得 到 幸运 划分 ,因此 确保 算法 总 的 效率 
在 期 望 的 范围 内 。 





11.4 ”选择 第 k 小 的 数 


给 定 包 含 ”个 元 素 度 无 序 序 列 A， 要 求 找到 其 中 第 上 小 的 数 。 比 如 输入 序列 
A=[21, 17, 30, 5, 8,19,10], 当天 王 4 时 , 返回 元 素 17; 当 上 = 5 时 , 返回 19。 当天 = [n/2] 
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时 , 实际 上 就 是 求 输入 序列 的 中 位 数 。 

以 上 问题 最 直观 的 解法 就 是 , 先 对 输入 序列 进行 排序 , 然后 根据 返回 排序 后 序列 
的 元 素 。 比 如 上 例 排序 后 的 序列 为 A_sorted=[5, 8, 10, 17, 19, 21, 30], 这 时 可 以 直接 根据 
太 从 A_sorted 返回 对 应 的 元 素 就 可 以 。 这 种 方法 的 算法 复杂 度 为 O(nlogn), 算法 的 时 
间 开 销 主要 在 排序 上 。 那么 有 没有 比 O(nlogn) 效率 更 高 的 算法 呢 ? 在 第 6.5 节 , 我 们 介 
绍 了 Blum 和 Floyd 等 提出 的 一 个 线性 时 间 O(n) 的 选择 算法 , 该 算法 是 分 治 算法 的 一 
个 巧妙 应 用 。 下 面 , 我 们 介绍 利用 随机 算法 来 实现 选择 的 方法 , 该 算法 的 时 间 复 杂 度 同 
样 是 O(n)。 

前 一 节 我 们 学 习 了 快速 排序 , 快速 排序 中 用 到 一 个 划分 函数 patition() ( 见 代 
码 11.3)。 这 里 还 会 用 到 该 函数 (实现 见 代 码 11.6), 它 的 功能 依然 是 将 一 个 序列 按照 支 
点 数 进行 划分 ,使 得 支点 数 的 左边 所 有 元 素 都 小 于 该 支点 数 , 而 支点 数 右边 的 所 有 元 素 
均 大 于 该 支点 数 (如 图 11.5)。 这 里 , 需要 在 函数 quick_select(A, i) 中 用 到 patition( )。 
函数 quick_select(A, 大 ) 的 功能 就 是 实现 从 序列 A 中 选择 第 小 的 数 。 如 果 随 机 选择 一 
个 支点 数 , 它 返 回 的 下 标 kv 恰好 等 于 ,那么 显然 这 时 支点 数 就 是 第 小 的 数 。 或者， 
还 存在 以 下 两 种 情况 : 

(1) 如 果 有 < 以,， 则 说 明 需 要 寻找 的 元 素 在 支点 数 的 左边 ,此 时 递归 调用 quick- 
gselect(A[I1 :kk’ — 1],k); 

(2) 如 果 玉 > 尼 ， 则 说 明 需 要 寻找 的 元 素 在 支点 数 的 右边 ,此 时 递归 调用 quick- 
select(A[k’ + 1..:k],k’ — k) 

经 过 这 样 一 次 比较 ， 就 可 以 排除 近 一 半 的 元 素 。 剩 余 的 元 素 可 以 利用 相同 的 办 法 ， 
逐步 缩小 查找 的 范围 , 直到 最 终 找到 满足 要 求 的 元 素 为 止 , 算法 实现 见 代码 11.5。 





代码 11.5 快速 选择 第 小 的 数 


def quick_ select(a,k): 
(left,pivot,right) = partition(a) 


if len(left)==k-1: # 支点 数 恰好 就 是 第 k 大 的 数 
result = pivot 

elif len(left)>k-1: # 第 k 大 的 数 在 左边 部 分 划分 , 递归 求解 
result = quick_ select(left,k) 

else: # 第 Kx 大 的 数 在 右边 部 分 划分 ,递归 求解 


result = quick_ select(right,k-len(left)-1) 


return result 





比如 ， 上 例 中 A=[21, 17, 30, 5, 8, 19, 10], = 4。 假设 初始 支点 数 pivot=10, 按 此 划 
分 后 的 序列 为 Al = [21,17,30,19,10,5,8]。 此 时 大 < k= 5, 则 返回 的 元 素 应 该 支点 数 
左边 , 即 [21, 17, 30, 19] 中 。 依 此 过 程 ,最终 返回 元 素 17。 代码 11.5 中 第 2 行 调用 函数 
partition( )， 实 现 对 A 的 划分 。partition( ) 函数 的 实现 见 代码 11.6。 


1 
2 
4 
5 
6 
7 
8 
9 
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代码 11.6 快速 选择 的 按 支 点 数 划分 函数 





def partition(a): 
## 边界 条 件 
if len(a)==1: 
Teturn([],a[0] ,[]) 
if len(a)==2: 
if a[0]<=a[1] : 
return([],a[0] ,a[1]) 
else: 
return([],a[1] ,a[0]) 
## 随机 选择 支点 数 
Pp = random.randint (0,1en(a)-1) # 支点 数 索 引 
pivot = a[p] # 支点 数 
right = [] # 右边 的 划分 
left = [] # 左边 的 划分 
for i in range(len(a)): 
if not i == p: 
if a[i] > pivot: 
right .append(a[i]) 
else: 
left .append(a[i]) 
return(left, pivot, right) 


以 上 算法 在 选择 支点 数 时 , 采用 了 随机 策略 。 由 于 随机 性 的 存在 , 它 能 保证 这 个 算 
法 的 时 间 复 杂 度 总 是 线性 时 间 吗 ? 下 面 我 们 将 证 明 , 以 上 算法 的 平均 执行 时 间 为 O(n)。 
为 了 更 好 地 理解 证 明 过 程 ,我 们 先 给 出 一 个 直观 的 解释 。 假 如 我 们 有 一 块 蛋糕 ， 随 机 的 
将 它 分 为 两 块 ,其 中 一 块 的 平均 大 小 为 原来 蛋糕 大 小 的 3/4。 每 次 我 们 总 是 选择 这 块 较 
大 的 蛋糕 继续 切 分 , 那么 我 们 切 分 的 次 数 可 以 用 递归 式 T(n) = T(3n/4) + O(m) 表示 ， 
可 以 证 明 该 式 T(n) < 4n, 也 就 是 切 的 次 数 是 n 的 线性 函数 。 但 是 , 需要 注意 的 是 , 由 于 
每 次 切 分 后 较 大 块 大 小 为 3n/4 是 一 个 均值 , 也 就 是 切 分 后 大 块 蛋糕 大 小 会 有 变动 。 

为 此 , 不 妨 设 T(n) 为 在 个 数 为 的 序列 找到 第 大 小 元 素 的 平均 时 间 。T(n) 包括 两 
个 部 分 : 四 将 输入 序列 一 分 为 二 的 时 间 , 所 需 的 计算 步 数 为 n; @ 切 分 后 处 理 剩余 序列 
的 时 间 。 但 是 , 由 于 支点 数 是 随机 选择 的 ,因此 似乎 并 不 能 准确 知道 这 个 剩余 序列 的 大 
小 。 然 而, 递归 分 解 得 到 的 两 个 子 序 列 大 小 要 么 是 0,n 一 1, 或 1,n 一 2, 或 2,n 一 3, 直 
到 nn 一 1,0。 因 此 , 可 得 























n—l 


了 (nm) 三 到 一 工 十 DE Pr(E;)(max(T(i), T(n— i))) (11.5) 
0 
式 中 Ei 表示 把 序列 划分 成 两 个 大 小 分 别 为 i 和 mn 一 i 的 子 序列 的 事件 。 式 中 之 所 以 
取 最 大 值 , 是 因为 为 了 求 得 算法 执行 时 间 的 上 界 , 总 是 选择 两 个 子 序列 中 较 长 的 做 为 下 
一 次 待 切 分 的 序列 。 
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此 外 , 由 于 max(T(?),T(n 一 让 ) 与 max(T(n 一 i),T(i)) 等 价 , 式 (11.5) 可 进一步 化 
简 得 : 


n/2—1 
T(n) < n+2 > Pr(E)(max(T(i),T(n —i))) (11.6) 


i=0 











于 是 随机 切 分 ,因此 序列 被 切 分 成 0,m 一 1, 或 1,n 一 2, 或 2,n 一 3, 直到 nn 一 1,0 
都 是 等 可 能 的 , 即 Pr(Ei) = 1/m,， 因此 可 得 : 
2 m/2 一 1 
T(n) sn+ 二 >》 max(T(i),T(n —i))) (ty 
n 


i=0 














下 面 将 利用 数学 归纳 法 , 证 明 根据 式 (11.7) 可 得 T(n) = O(n)。 
假设 对 i<n, 都 有 T(i) < ci。 由 此 , 得 
n/2—1 


T(n) Sn+t 2 》 (max(ei, cn —))) 
i=0 


nl 
和 
n+ 过 > (ci) 
im/2 
， (11.8) 
2 扫 ，. 
nt 5 > (2) 
i=n/2 
n+c(3n/4) =n(l+3c/4) 


< 4n(c= 4) 





因此 , 通过 随机 算法 实现 的 选择 第 大 小 的 算法 时 间 复 杂 度 为 O(n)。 


11.5 “寻找 最 小 割 边 


在 第 10 章 , 我 们 已 经 学 习 过 图 的 割 ,， 并 且 知道 了 最 大 流 最 小 割 定理 。 如 图 11.9 所 
示 , 把 图 G=(V, B) 的 结 点 V 分 割 成 两 个 部 分 S 和 S-V 的 边 的 集合 称 为 割 。 假 如 现在 
的 输入 是 无 向 图 G, 输出 是 把 图 G 分 割 成 两 个 部 分 的 最 小 割 ， 意 味 着 割 的 边 数 最 小 。 
图 11.9 中 所 示 的 割 就 是 最 小 割 , 该 制 的 边 数 为 2, 它 把 原 图 一 分 为 二 。 割 用 一 对 结 点 的 
集合 表示 , 即 (S, V-S)。 





图 11.9 割 的 示意 图 
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下 面 介绍 求解 最 小 割 的 随机 算法 ， 该 算法 由 David Karger 在 1993 年 提出 。 该 算法 
的 基本 思路 就 是 ,由 于 最 小 割 是 最 小 的 边 集合 , 因此 从 图 中 随机 的 选择 一 条 边 , 能 选 到 
属于 最 小 割 边 的 概率 较 低 ， 也 就 是 说 会 大 概率 选 到 不 属于 最 小 割 的 边 。 不 停 从 图 中 选择 
剩余 的 边 , 最 后 被 选中 的 边 就 将 它 当 作 最 小 割 的 边 。 算法 的 步骤 为 : 

(1) 如 果 剩余 的 结 点 超过 两 个 , 则 持续 进行 选择 ; 

。 随 机 的 选择 一 条 边 e, 其 中 该 边 的 两 个 结 点 为 u 和 v 
。 合 并 结 点 u 和 v, 得 到 新 的 图 

(2) 图 中 剩余 边 即 为 最 小 割 边 。 

以 图 11.10 所 示 的 为 例 ,随机 的 从 图 中 选择 第 一 条 边 , 假如 选择 的 是 C 连接 D 的 一 
条 边 , 用 粗 体 实 线 表示 。 然 后 ， 合并 这 两 个 结 点 C 和 DD, 得 到 新 的 图 并 随机 选择 边 (B， 
B)。 依 此 步骤 选择 边 ， 然 后 合并 结 点 。 当 图 剩余 两 个 结 点 时 ， 算 法 终止 ,此 时 剩余 边 即 为 
最 小 割 边 。 算法 实现 见 代码 11.7。 


© ® ® Gf 
of > > a We 
加 四 ] 


图 11.10 Karger 算法 示例 图 








代码 11.7 寻找 最 小 割 的 Karger 算法 


def choose_random key(G): 
vi = random.choice(list(G.keys())) 
V2 = random.choice(list(G[v1])) 


return vi, v2 


def karger(G): 
length = [] 
while len(G) > 2: 
v1，v2 = choose_random key(G) # 随机 选择 两 个 结 点 
G[v1] .extend(G[v2]) # 合并 v1 和 v2 
# 根据 合并 调整 边 的 连接 
for x in G[v2] : 
G[x] .remove(v2) 
G[x] .append (v1) 
while v1 in G[vi] : 
G[vi] .remove(v1) 
del G[v2] 


18 


19 
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for key in G.keys():  # 得 到 最 小 割 边 的 数量 
length.append(len(G[key])) 
return length[0] 








以 上 算法 非常 简单 ， 由 于 其 计算 遍历 了 所 有 边 ， 以 上 计算 过 程 的 时 间 复 杂 度 为 
O(|E|)。 然而 ,由 于 在 计算 过 程 使 用 了 随机 策略 , 因此 以 上 计算 并 不 总 能 确保 得 到 最 小 
割 边 。 如 图 11.11 所 示 , 初始 随机 选择 边 E=(C, D), 然后 合并 结 点 C 与 D。 然后， 随机 
的 选择 边 卫 =(A,B), 并 合并 这 两 个 点 。 此 时, 选择 合并 结 点 A 与 B 使 得 最 终 得 到 的 并 非 
最 小 割 。 








图 11.11 Karger 算法 并 不 能 总 是 得 到 最 小 割 


也 就 是 说 Karger 算法 属于 蒙特 卡 洛 随 机 算法 , 算法 按照 一 定 的 概率 得 到 正确 结 
果 。 假设 输入 图 有 个 结 点 , 该 算法 能 保证 其 得 到 正确 解 的 概率 为 Pr(2/n2)。 简单 地 
说 ，Karger 算法 只 要 能 保证 每 次 挑选 出 来 的 边 不 属于 最 小 割 就 可 以 确保 得 到 正确 解 ， 然 
而 由 于 是 随机 挑选 边 , 就 有 一 定 的 概率 选择 的 边 属于 最 小 割 边 ,从 而 导致 结果 出 错 。 因 
此 ， 只 需要 计算 各 次 挑选 的 边 不 属于 最 小 割 边 的 概率 ， 且 每 次 挑选 边 的 事件 相互 独立 ， 
这 样 就 可 以 算出 Karger 得 到 正确 解 的 概率 。 需 要 注意 的 是 ， 随 着 计算 次 数 的 累加 ， 出 
错 的 概率 会 依次 增加 ,这 是 因为 合并 后 图 会 越 来 越 小 。 这 个 结论 的 详细 证 明 可 以 参考 
https://www.cs.princeton.edu/courses/archive/falll3/cos521/lecnotes/lec2final.pdf。 

如 果 输 入 图 有 10 个 结 点 , 那么 按照 Karger 算法 , 获得 正确 解 的 概率 将 是 1/50。 也 
许 读 者 会 觉得 这 个 概率 非常 小 , 但 是 如 果 重 复 执行 Karger 算法 多 次 , 如 50? 次 , 然后 选 
择 这 2500 次 重复 计算 结果 的 最 优 值 作为 最 终 的 解 , 那么 获得 正确 解 的 概率 将 非常 大 。 重 
复 Karger 算法 "2 次 , 不 能 得 到 最 小 割 的 概率 为 


(1 -2/na) 酝 <l/e@ 
那么 如 果 重 复 Karger 算法 "2 logm 次 , 不 能 得 到 最 小 割 的 概率 为 


(1 —2/n2)¥ en < (I/ejmsn < 1/n 





因此 , 如 果 重 复 Karger 算法 1002log 100 次 , 那么 不 能 得 到 最 小 割 的 概率 为 1/100， 
也 就 是 说 获得 正确 解 的 概率 达到 99%。 








@ 对 任何 大 于 1 的 数 x, 有 1/4 < (1 一 1/z)”< 1/e 成 立 。 
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11.6 ”小 结 


学 习 了 随机 算法 ,读者 应 该 了 解 到 随机 并 非 占 卜 ,完全 靠 运气 。 随 机 算法 是 一 个 科 
学 的 计算 方法 。 就 蒙特 卡 洛 算法 而 言 ， 大 部 分 时 候 算法 输出 的 是 正确 结果 , 很 小 一 部 分 
时 候 是 不 正确 的 结果 。 但 是 , 之 所 以 能 够 容忍 有 错误 的 时 候 ， 是 为 了 加 快 算法 总 体 执行 
效率 。 特别 是 , 通过 增加 重复 , 可 以 提高 得 到 正确 解 的 概率 。 

对 拉 斯 维 加 斯 算法 而 言 ,其 计算 结果 总 是 正确 的 。 为 了 得 到 这 个 正确 的 结果 ,其 算 
法 执行 时 间 只 能 是 在 一 定 概率 下 是 多 项 式 时间 。 尽 管 鱼 与 熊 掌 不 可 兼 得 , 但 我 们 仍然 可 
以 设计 算法 , 让 它 以 很 高 的 概率 高 效 执行 。 


课 后 习题 
习题 11-1 ”列举 生活 中 你 采用 随机 算法 来 完成 的 事件 。 


习题 11-2 “古代 占卜、 算 填 常 常用 来 帮助 人 们 做 出 决策 , 请 从 算法 角度 解读 占 下 和 算 填 
背后 的 错误 。 


习题 11-3 ”设计 一 个 随机 算法 , 输出 一 个 素数 。 
习题 11-4 ”修改 代码 11.7, 让 它 可 以 返回 最 小 割 的 边 。 


第 12 章 ”算法 复杂 度 


本 章 学 习 目 标 
。 了 解 计算 问题 的 基本 分 类 
。 理解 P 问题 、NP 问题 、NPC 问题 的 定义 
。 了解 几 个 典型 的 NPC 问题 , 理解 为 什么 证 明 P 是 否 NP 是 计算 机 领域 最 为 重要 
的 问题 之 一 


12.1 引言 


到 目前 为 止 , 我 们 已 经 学 习 了 分 治 、 贪心 、 动 态 规划 等 各 种 设计 算法 的 方法 , 利用 这 
些 方法 已 经 高 效 地 解决 了 许多 问题 。 也 许 读者 会 想 , 只 要 我 们 足够 聪明 , 对 于 所 有 的 问 
题 似乎 都 能 找到 一 个 高 效 的 算法 。 通 过 这 章 的 学 习 , 将 会 发 现 原来 并 不 是 所 有 问题 都 有 
高 效 的 算法 , 甚至 有 些 问 题 根 本 就 没有 解 。 

这 章 将 学 习 如 何 对 问题 进行 分 类 , 并 且 会 介绍 一 类 特殊 的 问题 集合 , 叫 NPC 问题 
(NP-Complete)。NPC 问题 到 目前 为 止 , 依然 困扰 着 计算 机 理论 科学 家 ,因为 我 们 还 不 
知道 是 否 有 多 项 式 时 间 的 算法 去 求解 这 类 问题 。 也 许 有 ,也许 没 有 , 没有 人 能 给 出 确定 
的 回答 。 

通过 本 章 还 将 学 习 到 , 在 什么 情况 下 我 们 放弃 尝试 设计 多 项 式 时 间 复杂 度 的 算法 去 
求解 一 个 问题 。 本章 将 首先 介绍 问题 的 分 类 , 然后 再 分 别 介 绍 P 问题 、NP 问题 和 NPC 
问题 的 定义 。 最 后 , 将 简单 介绍 被 认为 是 计算 机 科学 王国 上 的 皇冠 的 一 个 问题 一 一 P 问 
题 是 否 等 于 NP 问题 。 


12.2 ”问题 的 分 类 


12.2.1 ” 易 解 与 难 解 

为 了 便于 研究 动物 , 动物 学 家 会 把 动物 依次 分 为 各 种 等 级 ， 即 域 、 界 、 门 、 纲 、 目 、 
科 、 属 、 种 等 八 个 主要 等 级 。 每 一 种 动物 , 都 可 以 给 它们 在 这 个 等 级 序列 中 冠 以 适当 的 
名 称 和 位 置 。 如 大 熊猫 ， 属于 动物 界 , 疹 椎 动物 门 、 哺 乳 纲 、 食肉 目 、 大 熊猫 科 、 大 熊猫 
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属 。 那么 为 什么 要 给 动物 进行 分 类 呢 ? 主要 的 目的 是 建立 反映 动物 系统 发 展 、 亲 玻 远近 
的 “家 谱 ” 一 一 亲缘 关系 ， 从 而 反映 动物 进化 的 过 程 和 趋向 。 

与 动物 分 类 类 似 , 在 前 面 章 节 遇 到 的 各 种 问题 , 我 们 能 否 根 据 一 定 的 准则 对 它们 进 
行 分 类 ? 分 类 的 好 处 之 一 就 是 , 对 于 同一 类 问题 , 也 许 求解 它们 的 算法 具有 共性 。 那么 该 
根据 什么 准则 来 对 问题 进行 分 类 呢 ? 一 个 简单 的 准则 就 是 求解 问题 的 难度 ,即将 问题 分 
为 易 解 和 难 解 两 类 。 

前 面 章节 遇 到 的 大 部 分 问题 都 是 易 解 问题 ， 比 如 : 

。 给 n 个 数 进行 排序 (第 5.2.1 节 、 第 5.2.2 节 和 第 5.2.3 节 ) 

。 在 给 定 的 有 向 无 环 图 中 , 找到 从 源 点 到 目的 点 的 最 短路 径 (第 8.4 节 ) 

。 求 连续 子 序列 和 的 最 大 值 (第 9.3.2 节 ) 等 

以 上 问题 的 共性 是 ， 其 算法 复杂 度 为 多 项 式 时 间 ， 也 就 是 算法 复杂 度 都 是 形 如 
O(n2), O(nlogn), O(m3)。 一 般 而 言 , 如 果 求解 一 个 问题 的 算法 复杂 度 为 O(n*), 其 中 下 
为 常数 , n 是 问题 的 输入 规模 ,那么 就 将 这 个 问题 称 为 易 解 问题 , 或 者 P (Polynomial) 
问题 , 英文 单词 Polynomial 的 意思 就 是 多 项 式 。 

也 许 有 读者 会 产生 疑问 , 多 项 式 的 定义 是 


QkNE akin 1 二. 十 an 二 ao (12.1) 


其 中 ，ak,ak-1…… ,alyao 均 为 常数 。 那 为 什么 算法 时 间 复 杂 度 为 O(logn) 或 
O(nlogn) 的 问题 也 是 易 解 问题 ? 尽管 logn 和 nlogn 不 是 多 项 式 形式 , 但 它们 的 上 界 
和 mn? 是 多 项 式 , 因此 我 们 称 算法 复杂 度 为 O(logn) 或 O(nlogn) 的 问题 为 易 解 问题 。 

如 果 某 个 问题 ， 其 算法 复杂 度 是 形 如 Q(27), Q(n!) 或 Q(k"), 其 中 下 为 常数 ,那么 
这 类 问题 就 不 能 称 为 易 解 问题 , 而 是 难 解 问题 。 比 如 4.4.3 节 遇 到 的 汉 诺 塔 问题 ,2.5.3 
节 的 子 集 和 问题 , 以 及 4.4.2 节 介 绍 的 列 出 n 个 元 素 的 全 排列 问题 , 求解 这 些 问 题 的 算 
法 时 间 复 杂 度 均 为 0(2")。 这 些 问题 当 输 入 数据 规模 较 大 时 , 根据 本 书 的 算法 其 运行 时 
间 都 是 按照 年 来 计算 的 天 文 时 间 , 因此 称 这 些 问题 为 难 解 问题 。 

根据 求解 问题 算法 的 时 间 复 杂 度 , 我 们 将 问题 分 为 了 易 解 与 难 解 问 题 。 难 解 问题 的 
时 间 复 杂 度 尽管 是 指数 规模 , 但 依然 是 可 求解 的 问题 。 这 是 不 是 意味 着 所 有 的 问题 都 可 
以 求解 呢 ? 其 实 不 然 , 除了 可 解 问题 外 ,其实 还 有 许多 问题 是 无 解 的。 比如 著名 的 停 时 间 
题 (Halting Problem) 就 没有 解 。 


12.2.2 ”无 解 的 问题 


以 Python 语言 为 例 , 假如 存在 一 段 程序 了 以 及 输入 I 我 们 要 确定 的 是 这 个 输入 为 
I 的 程序 P 是 否 会 运行 终止 ? 也 就 是 说 程序 了 会 不 会 无 限 循环 下 去 。 比 如 ,代码 12.1 对 
任意 的 输入 而 言 , 编译 运行 会 无 限 循环 下 去 , 也 就 是 说 函数 is_not_stop() 不 会 终止。 


So 


国 


S 
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代码 12.1 无 限 循环 的 函数 





def is_not_stop() : 
While True: 


continue 





而 代码 12.2 中 的 函数 is_stop() 对 于 任意 的 输入 工 都 可 以 终止 。 





代码 12.2 可 终止 的 函数 





def is_stop(): 
print("Hello World!") 





假如 存在 一 个 算法 A 可 以 解决 停 时 间 题 , 也 就 是 说 可 以 通过 算法 A 来 判断 代码 了 
及 输入 I 是否 不 会 陷入 无 限 循环 。 也 就 是 ， 

。A(P, IT) = 1, 如 果 输 入 为 I 的 程序 P 停 时 ; 

。A(P, IT) = 0, 如 果 输 入 为 I 的 程序 P 无 限 循环 。 

下 面 我 们 将 构造 一 个 特殊 的 函数 ABASHER， 并 证 明 当 该 函数 输入 是 代码 
ABASHER 时 ， 既 不 能 确定 它 是 停 时 ， 也 不 能 确定 它 是 否 为 无 限 循环 ， 即 该 问题 
无 解 。 


代码 12.3 构造 的 不 可 解 函数 


def ABASHER(P): 
if A(P, P) = 1: 
enter infinite loop 
else if A(P, P) = 0: 
stop 


ABASHER(ABASHER) 是 否 可 以 运行 终止 ? 这 里 函数 为 ABASHER, 函数 的 输入 
为 代码 ABASHER。 

如 果 ABASHER(ABASHER) 可 以 运行 终止 , 那么 根据 代码 12.3 第 4 行 , 意味 
着 A(ABASHER, ABASHER) = 0。 而 根据 之 前 的 假设 , 则 意味 着 当 A(ABASHER， 
ABASHER) = 0 时 ， ABASHER (ABASHER) 应 该 无 限 循环 下 去 。 这 意味 着 不 能 确定 
ABASHER(ABASHER) 是 否 可 以 运行 终止 。 

此 外 ， 如 果 ABASHER(ABASHER) 无 限 循环 ,根据 代码 12.3 第 2 行 , 意味 着 
A(ABASHER, ABASHER) = 1。 同 样 根据 之 前 的 假设 , 当 A(ABASHER, ABASHER) 
二 1 时 ，ABASHER (ABASHER) 应 该 停 时 ， 同 样 得 到 矛盾 的 结果 。 也 就 是 不 能 确定 
ABASHER(ABASHER) 是 否 会 无 限 循环 。 

以 上 表明 对 于 ABASHER(ABASHER) 既 不 能 判定 它 可 以 停 时 ,也 不 能 判定 它 无 限 
循环 运行 。 也 就 是 说 , 这 个 问题 不 能 用 算法 A 给 出 “正确 ”或 者 “错误 ”的 结论 , 即 该 问 
题 不 可 解 。 
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12.2.3 ” 难 解 问题 的 证 明 


根据 前 面 的 分 析 , 我 们 将 问题 分 为 可 解 与 无 解 两 个 大 类 , 可 解 的 问题 集合 里 面 又 分 
为 易 解 与 难 解 两 类 (如 图 12.1)。 然 而 , 在 可 解 的 问题 集合 中 , 在 易 解 的 上 界 与 难 解 问题 
的 下 界 之 间 , 还 存在 一 类 问题 。 这 类 问题 目前 的 算法 是 指数 复杂 度 , 但 是 目前 我 们 还 不 
能 证 明 这 些 问题 一 定 没有 多 项 式 时 间 复 杂 度 的 算法 。 下 面 将 举例 来 介绍 这 些 问 题 。 





多 项 式 时 间 内 求解 指数 时 间 内 求解 





给 n 个 数 排序 "个 元 素 全 排列 停 时 间 题 


图 12.1 问题 分 类 


旅行 商 问题 

中 国电 子 商务 的 发 展 得 益 于 物流 的 迅猛 发 展 ， 比 如 在 京东 、 亚 马 进 等 网 站 购物 后 ， 
也 许 第 二 天 就 可 以 收 到 购买 的 商品 。 假如 某 个 物流 公司 为 了 分 销 某 类 商品 , 需要 跑 遍 国 
内 的 661 个 城市 (如 图 12.2 左 图 )。 已 知 每 一 个 城市 之 间 的 距离 ， 需 要 规划 一 条 从 杭州 
出 发 , 途经 661 个 城市 中 的 每 一 个 城市 ,最 后 回 到 杭州 的 路 径 。 要 求 这 条 路 径 是 所 有 可 
行路 径 中 , 总 的 里 程 数 最 短 的 一 条 路 径 (如 图 12.2 右 图 )。 


图 12.2 TSP 问题 的 输入 与 解 


以 上 就 是 著名 的 旅行 商 问题 (Traveling Salesman Problem, TSP), 又 译 为 旅行 推销 
员 问 题 、 货 郎 担 问题 ， 简 称 为 TSP 问题 。TSP 的 历史 悠久 , 最 早 的 描述 是 1759 年 欧 拉 
研究 的 骑士 周游 问题 , 即 对 于 国际 象棋 棋盘 中 的 64 个 方 格 , 走访 64 个 方 格 一 次 且 仅 一 
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次 , 并 且 最 终 返 回 到 起 始点 。TSP 问题 在 数学 上 的 形式 化 描述 是 由 爱尔兰 数学 家 W.R. 
Hamilton 和 英国 数学 家 Thomas Kirkman 在 1800 年 提出 。 

TSP 问题 有 许多 的 应 用 ,比如 基因 (DNA) 排序 。DNA 的 片段 代表 城市 , DNA 片 
段 间 的 相似 度 为 城市 之 间 的 距离 , 目标 是 将 DNA 片段 进行 排序 , 得 到 总 的 相似 度 最 
小 。TSP 问题 在 天 文学 中 也 有 应 用 ,天 文学 家 通过 天 文 望远镜 观察 天 体 中 的 行星 和 恒 
星 , 行星 和 恒星 就 代表 TSP 问题 中 的 城市 , 城市 间 的 距离 则 是 天 文 望远镜 从 一 个 天 体 转 
向 男 一 个 天 体 的 时 间 , 要 求 规划 一 条 观察 天 体 的 路 径 , 使 得 天 文 望远镜 转向 时 间 最 小 。 

解决 TSP 问题 目前 已 知 最 快 的 算法 是 Held-Karp 算法 , 该 算法 于 1962 年 提出 , 其 
算法 复杂 度 为 O(n22")。 





最 大 团 问题 

微 信 是 腾讯 公司 开发 的 一 款 社交 软件 , 通过 该 软件 可 以 形成 朋友 圈 。 假 如 每 一 个 人 
代表 图 中 的 一 个 点 , 如果 两 人 相互 认识 , 则 图 中 对 cD 
应 的 两 点 之 间 存 在 一 条 边 。 最 大 团 问题 , 就 是 需要 G) 
从 给 定 图 中 找到 最 大 的 子 集 , 该 子 集 中 的 人 彼此 认 Sao 
识 。 图 12.3 中 结 点 集 [5, 1, 2] 就 是 图 中 的 最 大 团 。 © (2) 

目前 为 止 , 己 知 的 求解 最 大 团 问题 最 快 的 算法 
复杂 度 为 O(1.1888"), 由 Robson 于 2001 年 提出 。 图 12.3 最 大 团 问 题 


12.3 ”NPC 问题 应 用 


如 果 遇 到 一 个 复杂 的 问题 , 利用 已 经 学 习 的 算法 设计 技术 , 尝试 解决 这 个 问题 , 但 
是 却 只 能 得 到 一 个 指数 时 间 的 算法 。 我 们 是 继续 钻研 这 个 问题 , 并 力图 找到 一 个 多 项 式 
时 间 的 算法 , 还 是 放弃 寻找 更 优化 算法 的 尝试 。 如 果 放 弃 尝 试 , 那 我 们 的 理由 是 什么 ? 为 
了 得 到 这 个 理由 , 我 们 需要 先 了 解 什么 是 决策 问题 。 


12.3.1 ”决策 问题 


决策 问题 的 定义 非常 简单 , 如 果 一 个 问题 它 的 解 要 么 是 “正确 ”, 要么 是 “错误 ”， 那 
么 这 个 问题 就 是 一 个 决策 问题 。 也 就 是 说 , 问题 的 答案 非 此 即 彼 。 之 前 章节 遇 到 的 许多 
问题 , 都 可 以 转化 为 决策 问题 。 比 如 : 

(1) 给 定 一 个 序列 , 该 序列 是 递增 序列 吗 ? 

(2) 给 定 一 个 扑克 序列 , 是 否 存 在 满足 “疯狂 的 8” 的 序列， 且 该 序列 的 长 度 小 于 b。 

(3) 给 定 一 个 背包 问题 , 是 否 存 在 总 价值 至 少 为 V 的 解 ? 

(4) 给 定 一 个 带 权 重 的 图 , 是 否 存在 一 条 从 点 s 到 点 t 的 路 径 , 使 得 该 路 径 总 的 权重 
和 小 于 工 。 

(5) 给 定 一 个 带 权 重 的 图 , 是 否 存在 一 条 TSP 路 径 , 使 得 该 路 径 总 的 长 度 小 于 C。 

以 上 问题 都 是 典型 的 决策 问题 。 引入 决策 问题 这 一 概念 主要 有 两 个 原因 。 第 一 , 任何 
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的 计算 问题 都 可 以 转换 为 复杂 度 大 致 相等 的 决策 问题 。 比如 最 大 团 问 题 , 可 以 转换 为 判 
定 是 否 存 在 一 个 比 还 大 的 团 这 一 决策 问题 。 如 果 该 决策 问题 的 解 确定 了 , 就 可 以 通过 
二 分 法 来 求解 原 问题 。 第 二 , 有 了 决策 问题 , 我 们 就 可 以 对 问题 进行 化 约 (Reduction)。 





12.3.2 ”问题 的 化 约 


为 什么 要 对 问题 进行 化 约 ? 回 到 我 们 前 面 的 问题 , 对 于 问题 X 何 时 放弃 尝试 得 到 它 
的 多 项 式 算法 ? 如 果 能 找到 这 个 问题 X 等 价 的 复杂 问题 Q, 而 Q 问题 是 已 经 被 证 明了 
不 能 确定 它 是 否 有 多 项 式 时 间 算 法 。 这 时 就 有 充分 的 理由 , 考虑 放弃 寻找 X 问题 的 多 项 
式 时 间 算 法 。 找 到 X 问题 等 价 的 问题 Q, 就 需要 用 到 化 约 。 

对 于 化 约 有 以 下 两 个 重要 的 定理 。 第 一 个 定理 是 : 如 果 问 题 Li 可 以 在 多 项 式 时 间 
化 约 到 问题 L。, Lo 存在 多 项 式 时 间 的 算法 , 那么 问题 Li 也 存在 多 项 式 时 间 算 法 。 

这 里 需要 注意 的 是 , 问题 La 的 复杂 度 比 问题 Li 的 复杂 度 高 。 比 如 求解 一 元 一 次 方 
程 的 问题 为 Pi, 求解 一 元 二 次 方程 的 问题 为 P。 可 以 从 问题 Pi 化 约 到 问题 P。, 只 需要 
对 问题 Ps 增加 一 项 系数 为 0 的 二 次 项 。 显 然 , 求解 一 元 二 次 方程 的 算法 要 比 求解 一 元 
一 次 方程 复杂 。 并 且 , 如 果 已 知 一 元 二 次 方程 的 求解 算法 , 不 难得 到 一 元 一 次 方程 的 求 
解 算法 。 因 此, 问题 Li 化 约 到 问题 Ls, 问题 复杂 度 增 加 。 

化 约 的 第 二 个 定理 表明 化 约 满足 传递 性 。 如果 Li 可 以 化 约 到 La，Lsa 可 以 化 约 到 
La, 那么 就 可 以 从 Li 化 约 到 Las。 有 了 化 约 传递 性 的 概念 , 我 们 自然 会 想到 ,能 否 将 一 个 
问题 , 不 停 地 化 约 后 得 到 一 个 复杂 度 最 高 的 问题 。 按 照 化 约 的 定理 ,只 要 解决 了 这 个 复 
杂 度 最 高 的 问题 ,那么 所 有 能 化 约 到 它 的 问题 就 自然 有 解 了 。 是否 存 在 能 把 所 有 问题 都 
化 约 为 它 的 问题 , 或 者 说 是 否 存在 能 把 所 有 NP 问题 都 “ 吃 掉 ”的 问题 ? 答案 是 存在 , 而 
且 不 止 一 个 , 这 类 问题 就 是 NPC 问题 。 为 了 介绍 NPC 问题 , 我 们 首先 需要 了 解 什么 是 
NP 问题 。 





12.3.3 ”NP 问题 


有 了 决策 问题 , 我 们 就 可 以 给 出 NP 问题 的 定义 。 简单 地 说 , NP (Nondeterministic 
Polynomial) 问题 就 是 能 够 在 多 项 式 时间 确 定 其 解 是 否 正 确 的 问题 。 需要 注意 的 是 , NP 
问题 不 是 Non-Polynomial 的 缩写 , 也 就 是 说 NP 问题 不 是 多 项 式 时 间 不 能 求解 的 问 
题 。 NP 的 中 文 意思 是 多 项 式 复杂 程度 的 非 确定 性 , 它 的 意思 是 我 们 可 以 猜 出 一 个 解 , 然 
后 在 多 项 式 时 间 内 验证 这 个 解 是 否 正 确 。 

一 个 P 问题 是 不 是 NP 问题 呢 ? 比如 说 对 n 个 输入 序列 进行 排序 , 这 是 一 个 了 问 
题 , 可 以 在 多 项 式 时 间 求 解 。 显 然 , 排序 问题 也 是 NP 问题 ， 因 为 我 们 可 以 在 O(n) 时 
间 内 验证 排序 问题 的 解 是 否 正确 , 只 需要 依次 比较 各 个 数 即 可 。 因 此 , 我 们 说 P 问题 是 
NP 问题 的 子 集 , 也 就 是 说 一 个 P 问题 它 一 定 也 属于 NP 问题 。 

对 于 给 定 一 个 带 权重 的 图 , 是 否 存 在 一 条 TSP 路 径 , 使 得 该 路 径 总 的 长 度 小 于 C 
这 一 决策 问题 , 它 也 属于 NP 问题 。 因为 , 同样 可 以 在 多 项 式 时间 验 证 问题 给 出 的 解 是 
否 正确 。 因此, 对 问题 的 分 类 便 增 加 了 一 类 新 的 问题 集合 , NP 问题 ( 见 图 12.4)。 
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多 项 式 时 间 内 求解 指数 时 间 内 求解 


可 解 问题 集 





给 "个 数 排序 7 个 元 素 全 排列 
图 12.4 可 解 问题 分 类 


前 面 举例 的 最 大 团 问题 、 旅 行商 问题 都 是 NP 问题 , 因为 它们 都 可 以 在 多 项 式 时 间 
判定 给 定 的 解 是 否 正确 。 那么 有 没有 不 属于 NP 问题 的 问题 呢 ? 给 定 图 中 是 否 不 存在 
Hamilton 回路 这 一 问题 就 不 属于 NP 问题 ,为 了 理解 这 个 问题 , 我 们 首先 介绍 什么 是 
Hamilton 回路 。 

Hamilton 回路 

这 个 问题 由 天 文学 家 Hamilton 提出 。 给 定 一 个 无 向 图 ,从 图 中 的 任意 一 点 出 发 ， 
路 途中 经 过 图 中 每 一 个 结 点 当 且 仅 当 一 次 , 则 称 为 Hamilton 回路 (如 图 12.5)。 构 成 
Hamilton 回路 要 满足 两 个 条 件 : 

。 封闭 的 环 ; 

。 是 一 个 连通 图 , 且 图 中 任意 两 点 可 达 。 

如 果 问 题 是 : 给 定 一 个 无 向 图 , 求 出 一 条 Hamilton 回路 。 这 个 问题 是 一 个 NP 问题 ， 
因为 可 以 根据 Hamilton 回路 的 定义 , 在 多 项 式 时间 
验证 解 是 否 正确 。 然 而, 如 果 问 题 是 : 图 中 是 否 不 存 
在 Hamilton 回路 ? 这 个 问题 的 解 需 要 尝试 图 中 所 有 路 
径 , 才能 给 出 解 ， 而 尝试 所 有 路 径 显 然 不 能 在 多 项 式 
时 间 完 成 , 因此 这 个 问题 不 属于 NP 问题 。 

之 所 以 引入 NP 问题 ,是 因为 通常 只 有 NP 问题 
才 可 能 找到 多 项 式 的 算法 。 我 们 不 会 指望 一 个 连 多 项 
式 验证 其 解 都 不 行 的 问题 , 存在 一 个 解决 它 的 多 项 式 
的 算法 。 








图 12.5 _ Hamilton 回路 


12.3.4 NPC 问题 


NPC (NP Complete) @ 问题 需要 满足 两 个 条 件 。 首先 , 它 是 一 个 NP 问题 ; 其 次 ， 
所 有 的 NP 问题 都 可 以 化 约 为 它 。 因 此 , NPC 问题 就 是 前 面 我 们 说 的 能 “ 通 吃 ”所 有 NP 


@ NPC 是 D.Kuth 在 1973 年 通过 邮件 投票 的 形式 , 最终 选 定 的 名 字 。 
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问题 的 问题 。 由 定义 我 们 知道 以 下 两 个 事实 : 

。 如 果 能 给 出 一 个 多 项 式 算法 求解 一 个 NPC 问题 , 意味 着 所 有 NP 问题 都 有 多 项 

式 时 间 算 法 ; 

。 NPC 问题 是 NP 问题 集合 中 最 难 的 问题 。 

1971 年 ，S.Cook 在 计算 机 理论 界 一 个 非常 著名 的 会 议 上 宣布 了 布尔 可 满足 性 问题 
是 一 个 NPC 问题, 他 也 因为 这 项 工作 而 获得 了 1982 年 的 图 灵 奖 @. 另 一 位 计算 机 理论 
科学 家 R.Karp 随后 证 明了 有 21 个 问题 是 NPC 问题 , Karp 也 因 这 项 工作 获得 了 1985 
年 度 的 图 灵 奖 。 目 前, 已 知 的 NPC 问题 有 近 3000 个 。 

布尔 可 满足 性 问题 

布尔 表达 式 是 由 布尔 变量 和 运算 符 (NOT, AND, OR) 所 构成 的 表达 式 。 如 果 对 于 
变量 的 某 个 true, false 赋值 , 使 得 一 个 布尔 表达 式 的 值 为 true， 则 该 布尔 表达 式 是 可 满 
足 的 。 例如 布尔 公式 A = ((NOT z) AND y) OR (zx AND (NOT 2)), 当 z = false; y = 
true, z = false 时 , 该 布尔 表达 式 值 为 true, 则 表达 式 A 就 是 可 满足 的 。 可 满足 性 问题 
就 是 判定 一 个 给 定 的 合 取 范 式 的 布尔 公式 是 否 是 可 满足 的 。 

证 明 布 尔 可 满足 性 问题 是 NPC 问题 的 难点 在 于 ,如何 证 明 所 有 的 NP 问题 都 可 以 
化 约 为 布尔 可 满足 性 问题 。 总 不 能 列 出 所 有 的 NP 问题 , 然后 一 个 个 去 进行 化 约 。Cook 
的 证 明 巧 妙 的 利用 了 图 灵机 ， 有 兴趣 的 读者 可 以 在 The complezity of Theorem Proving 
Procedures 这 篇 论文 里 面 看 到 Cook 精妙 的 证 明 技巧 。 

何 时 放弃 

回 到 本 节 开 始 的 问题 。 在 遇 到 一 个 问题 时 ， 如果 不能 找到 多 项 式 时 间 算 法 , 我 们 应 
该 放弃 吗 ? 如 果 放 弃 继续 耗费 精力 解决 该 问题 , 那么 放弃 的 理由 是 什么 ? 有 了 NPC 问题 
的 定义 , 我 们 就 可 以 给 出 放弃 的 理由 。 如果 该 问题 被 证 明 是 NPC 问题, 那么 我 们 就 有 充 
是 的 理由 放弃 该 问题 。 因为 , 目前 还 没有 人 能 提出 一 个 多 项 式 时 间 算 法 求解 NPC 问题 。 

那么 , 该 如 何 证 明 一 个 问题 Q 是 NPC 问题 ? 简单 地 说 , 其 主要 步骤 如 下 : 

。 首先 , 证 明 该 问题 Q 是 一 个 NP 问题 ; 

。 选择 一 个 已 知 的 NPC 问题 R; 

。 证 明 该 NPC 问题 R 可 以 化 约 到 问题 Q。 

有 趣 的 NPC 问题 

本 章 出 现 的 Hamilton 回路 、 最 大 团 问题 、 布 尔 可 满足 性 问题 和 旅行 商 问题 都 已 经 
被 证 明了 是 NPC 问题 。 而 一 些 常 见 的 游戏 也 属于 NPC 问题 ， 比 如 数 独 游戏 问题 和 扫雷 
问题 。 

数 独 问题 是 起 源 于 日 本 的 填 数字 游戏 , 使 用 9 x 9 的 格子 。 需 要 根据 9 x 9 盘面 上 的 
已 知 数字 , 推理 出 所 有 剩余 空格 的 数字 , 并 满足 每 一 行 、 每 一 列 、 每 一 个 粗 线 宫 内 的 数字 
均 含 1 一 9 且 不 重复 (如 图 12.6 所 示 )。 


@ 苏联 科学 家 Leonid Levin 也 在 1972 年 独立 地 证 明了 类 似 的 定理 。 
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加 回国 吕 


图 12.6 数 独 游戏 





微软 的 扫雷 游戏 也 是 NPC 问题 。 游 戏 主 区 域 由 很 多 个 方 格 组 成 , 如 图 12.7 所 示 。 
使 用 鼠标 左 键 随机 单 击 一 个 方 格 , 方 格 即 被 打开 并 显示 出 方 格 中 的 数字 ; 方 格 中 数字 则 
表示 其 周围 的 8 个 方 格 隐藏 了 几 颗 雷 ; 如果 点 开 的 格子 为 空白 格 , 即 其 周围 有 0 颗 雷 ， 
则 其 周围 格子 自动 打开 ; 如 果 其 周围 还 有 空白 格 , 则 会 引发 连锁 反应 ; 在 你 认为 有 雷 的 
格子 上 , 单 击 右键 即 可 标记 雷 ， 如果 一 个 已 打开 格子 周围 所 有 的 雷 已 经 正确 标 出 ， 则 可 
以 在 此 格 上 同时 单 击 鼠标 左右 键 以 打开 其 周围 剩余 的 无 雷 格 。 























加 
| Et 2 ] 
2 3 到 二 | a2143 
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图 12.7 扫雷 游戏 


12.4 卫 等 于 NP 吗 








如 果 说 歌德 巴赫 猜想 是 数学 王国 的 皇冠 , 那么 P=NP? 问题 就 是 计算 机 科学 王国 的 
皇冠 。 有 一 个 叫 Clay Math 的 研究 所 ， 甚 至 悬赏 100 万 美元 给 解决 它 的 人 。 当 然 , 这 个 
研究 所 还 悬赏 了 另外 6 个 问题 , 它们 分 别 是 : 

。 霍 奇 (Hodge) 猜想 

。 庞 加 莱 (Poincare) 猜想 

e。 歼 曼 (Riemann) 假设 

。 杨 一 米尔 斯 (Yang-Mills) 存在 性 

。 纳 维 叶 一 斯 托 克 斯 (Navier-Stokes) 方程 的 存在 性 与 光滑 性 

。 贝 赫 (Birch) 和 斯 维 讷 通 一 戴尔 (Swinnerton-Dyer) 猜想 
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其 中 , 庞 加 莱 (Poincare) 猜想 被 俄罗斯 数学 家 格 里 戈 里 。 佩 雷 尔 曼 于 2003 年 左右 
证 明 。2006 年 ， 数 学界 最 终 确 认 佩 雷 尔 曼 的 证 明 解决 了 庞 加 莱 猜 想 。 但是, 令 人 意外 的 
是 佩 雷 尔 曼 拒绝 领取 Clay Math 研究 所 的 这 100 万 美元 奖金 。 
为 什么 P=NP? 问题 值得 巨额 悬赏 ? 不 妨 设 P=NP 成 立 , 因为 NPC 是 NP 的 子 集 ， 
那 也 意味 着 P=NPC。NPC 问题 是 NP 问题 中 复杂 度 最 高 的 问题 集合 , 其 中 每 一 个 NP 
问题 都 可 以 在 多 项 式 时 间 化 约 到 某 个 NPC 问题 。 这 意味 着 所 有 NP 问题 都 有 多 项 式 时 
间 的 解 。 也 许 这 样 的 描述 读者 还 不 一 定 清楚 其 中 的 意义 ,下面 通 过 一 些 更 具体 的 描述 来 
表明 , 如 果 P=NP 后 会 发 生 些 什么 有 趣 的 变化 。 
。 一 大 批 耳熟能详 的 游戏 ,如 扫雷 、 俄 罗斯 方块 、 超 级 玛丽 等 ， 人 们 将 为 它们 编写 
出 高 效 的 算法 , 使 得 电脑 玩 游戏 的 水 平 无 人 能 

。 整数 规划 、 旅 行商 问题 等 许多 运筹 学 中 的 难题 会 被 高 效 地 解决 ， 这 个 方向 的 研究 
将 提升 到 前 所 未 有 的 高 度 

。 蛋白质 的 折 秋 问题 也 是 一 个 NPC 问题 , 新 的 算法 无 疑 是 生物 与 医学 界 的 一 个 福 
音 , 对 人 类 疾病 预防 和 制药 水 平 将 会 产生 极 大 的 促进 

。 现实 中 用 的 好 多 加 密 算法 , 核心 都 是 归结 到 NP 不 等 于 P 上 的 。 如 果 我 们 找到 了 
多 项 式 时 间 算 法 , 很 多 密码 的 破解 时 间 会 被 大 大 减少 , 现在 的 网 银 将 不 再 安全 








12.5 ”小 结 


P 问题 是 易 解 问题 , 可 以 找到 多 项 式 时 间 的 算法 来 求解 P 问题 。 对 于 NPC 问题 ， 
似乎 目前 还 不 能 找到 多 项 式 时 间 算 法 。 但 是 , 这 并 不 意味 着 NPC 问题 不 可 求解 。 大 量 的 
近似 算法 (Approximation Algorithm) 能 够 保证 结果 与 最 优 解 的 误差 在 某 个 固定 范围 。 

近似 算法 的 设计 和 普通 的 算法 设计 没有 两 样 ， 可 能 用 到 贪心 , 也 可 能 用 到 线性 规划 ， 
它 就 是 一 个 普通 的 算法 。 应 用 近似 算法 要 求 算法 执行 时 间 必 须 是 多 项 式 时 间 , 这 是 因为 
我 们 牺牲 准确 度 就 是 为 了 换取 时 间 。 另 外 一 个 常用 的 求解 NPC 问题 的 方法 就 是 临 域 搜 
索 和 启发 式 搜索 。 本 书 并 未 涉及 以 上 算法 , 感 兴趣 的 读者 可 以 参考 DP Williamson 写 
的 《近似 算法 设计 》 一 书 。 

NP 问题 简单 地 说 就 是 多 项 式 时 间 可 以 验证 解 是 否 正确 的 问题 , 目前 理论 计算 机 界 
对 于 P=NP? 并 不 能 给 出 一 个 令 人 信服 的 证 明 。 这 意味 着 对 于 已 知 的 近 3000 个 NPC 问 
题 , 我 们 并 不 知道 是 否 存在 多 项 式 时 间 复 杂 度 的 算法 去 求解 它们 。 

我 们 畅想 了 如 果 P=NP 后 的 前 景 ， 它 可 能 给 我 们 的 生活 带 来 诸多 便利 ， 也 会 给 生活 带 
来 许多 隐患 。 它 好 比 一 柄 双 刃 剑 , 掌握 它 的 人 类 也 许 目 前 还 没有 足够 的 力量 去 利用 好 这 柄 双 
刃 剑 , 这 也 许 就 是 目前 大 部 分 计算 机 科学 家 都 倾向 于 认为 P 问题 不 等 于 NP 问题 的 原因 吧 。 











课 后 习题 


习题 12-1 ”NPC 问题 就 是 很 难 的 问题 吗 ? 说 明理 由 。 
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习题 12-2 ”给 出 NP 和 NPC 问题 的 区 别 。 


习题 12-3 ”图 的 覆盖 是 一 些 项 点 〈 或 边 ) 的 集合 , 使 得 图 中 的 每 一 条 边 (每 一 个 顶点 ) 
都 至 少 接触 集合 中 的 一 个 顶点 ( 边 )。 寻找 最 小 的 顶点 覆盖 的 问题 称 为 顶点 覆盖 问题 , 它 
是 一 个 NPC 问题 。 请 给 出 一 个 近似 算法 求解 该 问题 。 


习题 12-4 ”给 出 一 个 求解 旅行 商 问题 的 近似 算法 。 
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8.4 
8.5 
8.6 


9.1 
9.2 
9.3 
9.4 
9.5 
9.6 
全 7 
9.8 
9.9 
9.10 
9.11 
9.12 
9.13 
9.14 


eo Ld EE 5 2 PSC 105 


6 113 
得 到 图 所 有 的 边 
图 与 BFS 结果 类 定义 .… a 
i 116 
利用 BFS 求 最 短路 径 .… 
返回 最 短路 径 …………… 
定义 输出 结果 类 
寻找 下 一 个 状态 
DFS 结果 类 .…. 
DFS 的 递归 实现 .… 
DFS 主 函数 .… 
基于 堆栈 的 DFS 算法 实现 i 
FE 1 2 OO 和 丰 计 交 相生 于 矶 站 全 法 125 


























硬币 找 零 的 贪心 算法 
间隔 任务 规划 的 贪心 算法 
Dijkstra 算法 伪 代 码 
改进 的 Dijkstra 算法 伪 代 码 
基于 堆 结构 的 Dijkstra 算法 
最 小 生成 树 的 Prim 算法 









利用 记忆 求解 斐 波 那 契 数 .…. 
自 底 向 上 求解 斐 波 那 契 数 .…. 二 
自 属 同上 实现 着 阿 纺 有 NRECEAAR 154 
回溯 得 到 拾 捡 硬币 问题 最 优 解 
自 底 向 上 实现 子 序列 和 最 大 值 的 递归 策略 .…. 
同 湖 得 到 子 序列 和 有 最 大 问题 的 最 优 解 .sa i 157 
自 底 向 上 求解 疯狂 的 8.… 
判断 两 张 扑 克 是 否 匹 配 .… 
随机 产生 扑克 
得 到 疯狂 的 8 的 问题 解 . 
文字 排版 的 动态 规划 算法 .… 
21 点 问题 的 动态 规划 算法 
玩家 和 庄家 抓 牌 函数 .… 
矩阵 括号 问题 的 动态 规划 实现 … 
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9.15 
9.16 
9.17 


10.1 
10.2 


M1 
11.2 
11.3 
11.4 
11.5 
11.6 
17 


12.1 
12.2 
12.3 


字符 串 编辑 距离 的 动态 规划 实现 .…. 








Ei i wa 178 
ion 虹 天 潜 人 村 ne 188 
按照 BRS9 守 扫 可 扩展 路 入 so00rnnneo 189 
关 时 第 阵 汪 各 卫 果 是 而 相信 a 197 
重 受 判断 如 商 诈 确 的 概 字 asm ri 198 
按照 支点 数 划分 序列 .. 





快速 排序 算法 
快速 选择 第 小 的 数 
快速 选择 的 按 支 点 数 划 分 函数 
寻找 最 小 割 的 Karger 算法 












无 限 循环 的 函数 .. 
可 终止 的 函数 .…. 
pa Ys 212 
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